COMBINATION OF NUCLEIC ACID SEQUENCES ENCODING PROTEINS DERIVED FROM HELICHRYSUM UMBRACULIGERUM, AND ANY TRANSGENIC CELL, TISSUE, AND ORGANISM COMPRISING SAME

REFERENCE TO AN ELECTRONIC SEQUENCE LISTING

The contents of the electronic sequence listing (YEDA-P-010-PCT.xml; size: 251,312 bytes; and date of creation: Aug. 20, 2023) is herein incorporated by reference in its entirety.

FIELD OF INVENTION

The present invention relates to combinations of enzymes derived from Helichrysum umbraculigerum including polynucleotides encoding same, and methods of using same, such as for producing cannabinoids.

BACKGROUND

Cannabinoids are terpenophenolic compounds found in Cannabis sativa, an annual plant belonging to the Cannabaceae family. The plant contains more than 400 chemicals and approximately 70 cannabinoids. The latter accumulate mainly in the glandular trichomes. Of the naturally occurring cannabinoids, tetrahydrocannabinol (THC), for example, is used for treating a wide range of medical conditions, including glaucoma, AIDS wasting, neuropathic pain, treatment of spasticity associated with multiple sclerosis, fibromyalgia, and chemotherapy-induced nausea. THC is also effective in the treatment of allergies, inflammation, infection, epilepsy, depression, migraine, bipolar disorders, anxiety disorder, drug dependency and drug withdrawal syndromes.

Additional active cannabinoids include cannabidiol (CBD), an isomer of THC, which is a potent antioxidant and anti-inflammatory compound known to provide protection against acute and chronic neuro-degeneration; cannabigerol (CBG), found in high concentrations in hemp, which acts as a high affinity α2-adrenergic receptor agonist, moderate affinity 5-HT1A receptor antagonist and low affinity CB1 receptor antagonist, and possibly has anti-depressant activity; and cannabichromene (CBC), which possesses anti-inflammatory, anti-fungal and anti-viral properties. Many phytocannabinoids have therapeutic potential in a variety of diseases and may play a relevant role in plant defense as well as in pharmacology. Accordingly, biotechnological production of cannabinoids and cannabinoid-like compounds with therapeutic properties is of uttermost importance. Thus, cannabinoids are considered to be promising agents for their beneficial effects in the treatment of various diseases.

Despite their known beneficial effects, therapeutic use of cannabinoids is hampered by the high costs associated with the growing and maintenance of the plants in large scale and the difficulty in obtaining high yields of cannabinoids. Extraction, isolation and purification of cannabinoids from plant tissue is particularly challenging as cannabinoids oxidize easily and are sensitive to light and heat.

Therefore, there is a need for developing methodologies that allow large-scale production of cannabinoids for therapeutic use.

SUMMARY

According to a first aspect, there is provided an isolated DNA molecule comprising at least a first nucleic acid sequence encoding a first protein and at least a second nucleic acid sequence encoding a second protein, wherein the first protein and the second protein are derived from Helichrysum umbraculigerum and belonging to an enzyme family selected from the group consisting of: acyl activating enzyme (AAE), polyketide synthase (PKS), polyketide cyclase (PKC), prenyltransferase (PT), and cannabichromenic acid synthase (CBCAS), and wherein the first protein and the second protein belong to different enzyme families.

According to another aspect, there is provided an artificial nucleic acid molecule comprising the isolated DNA molecule disclosed herein.

According to another aspect, there is provided a plasmid or an agrobacterium comprising the artificial nucleic acid molecule disclosed herein.

According to another aspect, there is provided a transgenic cell comprising: (a) the isolated DNA molecule of the invention; (b) the artificial nucleic acid molecule disclosed herein; (c) the plasmid or agrobacterium disclosed herein; or (d) any combination of (a) to (c).

According to another aspect, there is provided an extract derived from the transgenic cell of disclosed herein, or any fraction thereof.

According to another aspect, there is provided transgenic plant, a transgenic plant tissue or a plant part, comprising: (a) the isolated DNA molecule of the invention; (b) the artificial nucleic acid molecule disclosed herein; (c) the plasmid or agrobacterium disclosed herein; (d) the transgenic cell disclosed herein; or (e) any combination of (a) to (d).

According to another aspect, there is provided a composition comprising: (a) the isolated DNA molecule of the invention; (b) the artificial nucleic acid disclosed herein; (c) the plasmid or agrobacterium disclosed herein; (d) the transgenic cell disclosed herein; (e) the extract disclosed herein; (f) the transgenic plant tissue or plant part disclosed herein; or (g) any combination of (a) to (f), and an acceptable carrier.

According to another aspect, there is provided a method for synthesizing a cannabinoid, a precursor thereof, or any combination thereof, comprising the steps: (a) providing a transgenic cell or a cell transfected with the isolated DNA molecule of the invention or the artificial nucleic acid molecule disclosed herein; and (b) culturing the transgenic cell or the transfected cell from step (a) such that at least the first protein and the second protein encoded by the artificial nucleic acid molecule are expressed, thereby synthesizing the cannabinoid, a precursor thereof, or any combination thereof.

According to another aspect, there is provided an extract of a transgenic cell or a transfected cell obtained according to the herein disclosed method.

According to another aspect, there is provided a composition comprising the extract disclosed herein, and an acceptable carrier.

In some embodiments, the isolated DNA molecule further comprises at least a third nucleic acid sequence encoding a third protein derived from H. umbraculigerum and belonging to an enzyme family selected from the group consisting of: AAE, PKS, PKC, PT, and CBCAS, and wherein the first protein, the second protein, and the third protein, belong to different enzyme families.

In some embodiments, the isolated DNA molecule further comprises at least a fourth nucleic acid sequence encoding a fourth protein derived from H. umbraculigerum and belonging to an enzyme family selected from the group consisting of: AAE, PKS, PKC, PT, and CBCAS, and wherein the first protein, the second protein, the third protein, and the fourth protein, belong to different enzyme families.

In some embodiments, the isolated DNA molecule further comprises at least a fifth nucleic acid sequence encoding a fifth protein derived from H. umbraculigerum and belonging to an enzyme family selected from the group consisting of: AAE, PKS, PKC, PT, and CBCAS, and wherein the first protein, the second protein, the third protein, the fourth protein, and the fifth protein, belong to different enzyme families.

In some embodiments, the isolated DNA further comprises a nucleic acid sequence encoding a protein derived from H. umbraculigerum and belonging to an enzyme family selected from the group consisting of: uridine diphosphate (UDP)-glycosyltransferase (UGT), alcohol acyltransferase (AAT), and both.

In some embodiments: (a) the AAE is encoded by a nucleic acid sequence having at least 89% homology to any one of SEQ ID Nos.: 1-11, and any combination thereof; (b) PKS is encoded by a nucleic acid sequence having at least 83% homology to any one of: SEQ ID Nos.: 23-26, and any combination thereof; (c) PKC is encoded by a nucleic acid sequence having at least 88% homology to any one of: SEQ ID Nos.: 31-38, and any combination thereof; (d) PT is encoded by a nucleic acid sequence having at least 91% homology to any one of: SEQ ID Nos.: 47-58, and any combination thereof; (e) CBCAS is encoded by a nucleic acid sequence having at least 82% homology to any one of: SEQ ID Nos.: 71-79, and any combination thereof; or (f) any combination of (a) to (e).

In some embodiments: (a) the UGT is encoded by a nucleic acid sequence having at least 87% homology to any one of: SEQ ID Nos.: 89-101, and any combination thereof; (b) the AAT is encoded by a nucleic acid sequence having at least 87% homology to any one of: SEQ ID Nos.: 115-129, and any combination thereof; or (c) both (a) and (b).

In some embodiments: (a) AAE comprises an amino acid sequence with at least 93% homology to any one of SEQ ID Nos.: 12-22; (b) PKS comprises an amino acid sequence with at least 93% homology to any one of: SEQ ID Nos.: 27-30; (c) PKC comprises an amino acid sequence with at least 87% homology to any SEQ ID Nos.: 39-46; (d) PT comprises an amino acid sequence with at least 92% homology to any one of: SEQ ID Nos.: 59-70; (e) CBCAS comprises an amino acid sequence with at least 86% homology to any one of: SEQ ID Nos.: 80-88; (f) or any combination of (a) to (e).

In some embodiments: (a) the UGT comprises an amino acid sequence with at least 90% homology to any one of: SEQ ID Nos.: 102-114; (b) the AAT comprises an amino acid sequence with at least 91% homology to any one of: SEQ ID Nos.: 130-144; or (c) both (a) and (b).

In some embodiments: (a) the AAE consists of an amino acid sequence of any one of SEQ ID Nos.: 12-22; (b) the PKS consists of an amino acid sequence of any one of SEQ ID Nos.: 27-30; (c) the PKC consists of an amino acid sequence of any one of SEQ ID Nos.: 39-46; (d) the PT consists of an amino acid sequence of any one of SEQ ID Nos.: 59-70; (e) the CBCAS consists of an amino acid sequence of any one of SEQ ID Nos.: 80-88; (f) or any combination of (a) to (e).

In some embodiments: (a) the UGT consists of an amino acid sequence of any one of: SEQ ID Nos.: 102-114; (b) the AAT consists of an amino acid sequence of any one of: SEQ ID Nos.: 130-144; or (c) both (a) and (b).

In some embodiments, the isolated DNA molecule comprises a plurality of isolated DNA molecule types.

In some embodiments, each type of the plurality of isolated DNA molecule types encodes a protein or a plurality of proteins belonging to a different enzyme family.

In some embodiments, the transgenic cell is any one of: a unicellular organism, a cell of a multicellular organism, and a cell in a culture.

In some embodiments, the unicellular organism comprises a fungus or a bacterium. In some embodiments, the fungus is a yeast cell.

In some embodiments, the transgenic cell is a transgenic Cannabis sativa cell.

In some embodiments, the extract comprises a cannabinoid, a precursor thereof, or a combination thereof.

In some embodiments, the precursor is selected from the group consisting of: acyl coenzyme A (CoA), a polyketide, a resorcinoid precursor, and any combination thereof.

In some embodiments, the acyl is C1-C8 alkyl.

In some embodiments, the acyl CoA is hexanoyl CoA.

In some embodiments, the polyketide is a tetraketide.

In some embodiments, the tetraketide is a linear tetraketide.

In some embodiments, the resorcinoid precursor is olivetolic acid.

In some embodiments, the cannabinoid is cannabigerolic acid (CBGA), CBCA, or both.

In some embodiments, the artificial nucleic acid molecule is an expression vector.

In some embodiments, the transgenic cell or the transfected cell is a prokaryote cell or a eukaryote cell.

In some embodiments, the transgenic cell or the transfected cell is a C. sativa cell.

In some embodiments, the method further comprises a step preceding step (a), comprising introducing or transfecting a cell with the artificial nucleic acid molecule, thereby obtaining the transgenic cell or the transfected cell.

In some embodiments, the method further comprises a step of extracting the transgenic cell or the transfected cell, thereby obtaining an extract from the transgenic cell or the transfected cell.

In some embodiments, the extract comprises a cannabinoid, a precursor thereof, or any combination thereof.

Unless otherwise defined, all technical and/or scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which the invention pertains. Although methods and materials similar or equivalent to those described herein can be used in the practice or testing of embodiments of the invention, exemplary methods and/or materials are described below. In case of conflict, the patent specification, including definitions, will control. In addition, the materials, methods, and examples are illustrative only and are not intended to be necessarily limiting.

Further embodiments and the full scope of applicability of the present invention will become apparent from the detailed description given hereinafter. However, it should be understood that the detailed description and specific examples, while indicating preferred embodiments of the invention, are given by way of illustration only, since various changes and modifications within the spirit and scope of the invention will become apparent to those skilled in the art from this detailed description.

BRIEF DESCRIPTION OF THE FIGURES

The patent or application file contains at least one drawing executed in color. Copies of this patent or patent application publication with color drawing(s) will be provided by the Office upon request and payment of the necessary fee.

FIGS. 1A-1I include structures of chemical compounds, images, a chromatogram, a table, and micrographs showing that H. umbraculigerum biosynthesizes CBGA 1 and other terpenophenols in all aerial plant parts. (1A) Proposed biosynthetic pathways of CBGA 1 and heliCBGA 2. (1B) Photographs of the H. umbraculigerum plant inflorescence (up) and shoot (down). (1C) Total ion chromatogram of an ethanolic extract of H. umbraculigerum fresh leaves. The most abundant peaks of identified metabolites are marked on the Figure and color-coded according to the class of terpenophenol. CBGA 1 and heliCBGA 2 are highlighted in red and blue, respectively. (1D) Absolute quantification of CBGA 1 in different plant tissues [% w/w per fresh weight, n=3; for lyophilized leaves % w/w per dry weight (DW), n=5]. Reported Cannabis values were added for comparison. (1E) Chemical structures and names of selected terpenophenols with similar chemical formulas as 1-3. Representative (1F) cryo-SEM and (1G) confocal micrographs of the adaxial top view domain of leaves showing stalked glandular trichomes (marked by arrows). (1H) TEM micrograph showing the multicellular structure of the different cell types in a stalked glandular trichome at secretory stage. BC, basal cell; SC, stalk cell; NC, neck cell; DC, disk cell; SCv, secretory cavity. The dashed line marks the surface of the SCv. (1I). High magnification image shows the ultrastructure of DCs. CW, cell wall; M, mitochondria; N, nucleus; P, plastid; PSP, periplasmic space; V, vacuole; Vs, vesicle. Arrows mark active secretions from vesicles to the periplasmic space by exocytosis.

FIGS. 2A-2E include fluorescent micrographs, graphs, and a scheme showing that cannabinoid-associated gene expression is correlated with cannabinoid metabolites accumulation in H. umraculigerum glandular trichomes. (2A) Optical image and (2B) MALDI-MSI of m/z 361.23±0.01 Da of a cross-sectioned leaf showing that CBGA 1 accumulates in stalked glandular trichomes of leaves. Glandular trichomes in (2A) are marked to improve interpretation. The signals in (2B) correspond with the protonated m/z of CBGA 1 and geranylphlorocaprophenone 4. (2C) Normalized Enrichment Score (NES) of each co-expressed module in each tissue. Module M4 is highlighted as it is highly expressed in trichomes and leaves. (2D) Spaghetti chart showing the expression profile of module M4. The expression levels of individual genes are shown in gray lines. Colored lines highlight the expression of candidate genes from the pathway. (2E) Genomic landscape of the eight longest scaffolds of H. umbraculigerum assembly. Track i represents the gene density; ii represents repeat element density; iii represents 3′ Tran-Seq coverage; iv represents TrueSeq coverage. These metrics are calculated in 0.1 Mb non-overlapping windows. Magnification of the marked area in scaffold 1 reveals a tandem gene cluster containing seven PKSs. The enzymes HuPKS1-3 and HuTKS4 were cloned and functionally characterized in this study.

FIGS. 3A-3F include a heatmap, graphs, and a table showing the discovery of the core cannabinoid biosynthetic pathway enzymes. (3A) Gene expression in young leaves, roots and trichomes of the putative enzymes characterized in this study [log (cpm+1), n=3]. The most active enzymes in this study were highlighted in pink. AAE, acyl activating enzyme; PKS, type III polyketide synthase; PKC, polyketide cyclase; PT, prenyl-transferase. (3B) Products of recombinant enzyme assays of purified HuAAE proteins using various alkyl (short- and medium-chain FAs) and aromatic (cinnamic and coumaric acids) substrates. Peak areas were used for the comparisons (mean±s.d.; n=3). CoAT, acyl-CoA-transferase; EV, empty. (3C) Products of coupled recombinant enzyme assays of HuPKSs with either an EV or Cannabis olivetolic acid cyclase (CsOAC), in the presence of hexanoyl-CoA and malonyl-CoA. PDAL, pentyl diacetic acid lactone; HTAL, hexanoyl triacetic acid lactone; OA 92, olivetolic acid; PCP 95, phlorocaprophenone. Peak areas were used for the comparisons (mean±s.d.; n=3). OA 92 and PCP 95 were identified using analytical standards ([M−H]⁻=223.097 Da). (3D) Activity assay of microsomal fractions expressing prenyltransferases (PTs) using an array of aromatic substrates and either geranyl pyrophosphate (GPP) or isopentenyl pyrophosphate (IPP) as the isoprenoid donors. Circles represent observed mono- or iso-prenylated products in H. umbraculigerum or in vitro assays. VA, divarinolic acid; DHSA 93, dihyrostilbenic acid; ND, not detected; CBGAS, cannabigerolic acid synthase. (3E) Steady state kinetic analysis of HuPT1, HuPT3 and HuCBGAS4 with OA 92 and GPP. The Michaelis-Menten Km values were calculated using varying (0.5 μM-3 mM) and constant (1 mM) concentrations of each substrate (n=3). The literature Km value of Cannabis CsGOT4 was added for comparison. (3F) Phylogenetic analysis of PT proteins from H. umbraculigerum and other plants. The selection of the proteins was based on functionally characterized enzymes as described by de Bruijn et al. (2020). The clades according to the different substrates are marked in colored circles. HuPT proteins are highlighted in red, while Cannabis and Rhododendron dauricum PTs which prenylate cannabinoids are highlighted in blue. A H. umbraculigerum flower and a Cannabis leaf highlight the active HuCBGA4 and CsGOT4, respectively. A full list of protein IDs is available in Berman et al., “Parallel evolution of cannabinoid biosynthesis”; Nature Plants 9 817-831 (2023).

FIGS. 4A-4F include a phylogenetic tree, a heatmap, a table, chromatograms, and structure of chemical compounds showing the functional characterization of cannabinoid tailoring enzymes. (4A) Phylogenetic analysis of selected uridine diphosphate-glycosyltransferase (UGT) proteins from H. umbraculigerum, Arabidopsis thaliana, Oryza sativa and Stevia rebaudiana. The clades were annotated according to Arabidopsis thaliana UGT family classification (numbers in colored circles). HuUGT proteins are highlighted in red, while other proteins from plant species not producing cannabinoids that were shown previously to be able to glycosylate cannabinoids are highlighted in blue. A full list of protein IDs is available in Berman et al., “Parallel evolution of cannabinoid biosynthesis”; Nature Plants 9 817-831 (2023). H. umbraculigerum flowers mark the active HuCBGT1, HuCBGT6 and HuOAGT11. 4-Hydroxybenzoic acid (4-HBA) and 2,4-dihydroxybenzoic acid (2,4-DHBA) which are structurally similar to OA 92 and CBGA 1 are located next to the UGT enzymes that glycosylate them. Glycosylated hydroxyls are highlighted. (4B) Gene expression in young leaves, roots and trichomes of the putative UGT and alcohol acyl transferase (AAT) enzymes characterized in this study [log (cpm+1), n=3]. The enzymes found most active in this study were highlighted in pink. (4C) Comparison of steady state kinetic analysis of HuOAGT11 and HuUGT13 versus OsUGT and SrUGT, with OA 92 and uridine diphosphate glucose (UDP-Glc). Assays were performed using varying (0.5 μM-3 mM) and constant (1 mM) concentrations of each substrate (n=3). (4D) Extracted ion chromatograms of monoglucosides according to the theoretical m/z values, following enzymatic assays with the purified enzymes in the presence of UDP-Glc and an array of aromatic substrates (additional assays appear in FIG. 12B). One to three glucosylated compounds were observed for each substrate. The peaks were putatively assigned by MS/MS fragmentation patterns (Berman et al., “Parallel evolution of cannabinoid biosynthesis”; Nature Plants 9 817-831 (2023)). Compounds naturally observed in H. umbraculigerum were marked with a green asterisk. Chromatograms were normalized to the highest value. (4E) Extracted ion chromatograms of the O-acylated cannabinoids following enzymatic assays with purified HuCoAT5 in the presence of different acyl donors and aromatic substrates as acceptors. Major ion products were selected in each LC-MS/MS chromatogram. A single peak was observed for each pair of substrates. The detected analog peaks shifted in retention time depending on their change in hydrophobicity relative to the acyl group. Identification was performed according to MS/MS fragmentation (FIG. 13, and Berman et al., “Parallel evolution of cannabinoid biosynthesis”; Nature Plants 9 817-831 (2023)) and retention time. Compounds naturally observed in H. umbraculigerum were marked with a purple asterisk. Chromatograms were normalized to the highest value. (4F) Potential glucosylation and observed O-acylation sites were highlighted in blue and/or purple on each chemical structure, respectively.

FIGS. 5A-5D include combination diagrams and graphs showing in vivo reconstruction of the core cannabinoid pathway in heterologous systems. Co-expression of different combinations of HuCoAT6, HuTKS4, and HuCBGAS4, along with CsOAC and CsOLS from Cannabis in (5A-5B) N. benthamiana leaves and (5C-5D) S. cerevisiae yeasts. Grey, yellow, and green boxes to the left of the graphs indicate biosynthetic genes that are included in a co-expression experiment; blue boxes mark supplementation of geranyl pyrophosphate (GPP) and either (5A and 5C) sodium hexanoate (HexNa) or (5B and 5D) OA 92. Peak areas were used for the comparisons (mean±s.d.; n=3-6). N. benthamiana produced mainly glycosylated products identified according to the previously conducted in vitro UGT enzyme assays (FIGS. 4D and 12B). All the metabolites were identified by exact mass, retention time and MS/MS spectra (Berman et al., “Parallel evolution of cannabinoid biosynthesis”; Nature Plants 9 817-831 (2023)). EV, empty vector.

FIG. 6 includes a scheme showing parallel and divergent evolution of the cannabinoid biosynthetic pathway. The scheme provides a side-by-side comparison of the cannabinoid biosynthetic routes in H. umbraculigerum and Cannabis. On the top part, the phylogenetic relationship between Arabidopsis thaliana, Solanum lycopersicum, Helianthus annuus, Letuca sativa, Cannabis sativa and Helicrysum umbraculigerum illustrates the evolutionary distances between Cannabis and Helicrysum. The tree was constructed based on the whole proteomes of each species using the word-based software Prot-SpaM. Hybrid, yet unreported metabolites were produced in this study by reacting cannabinoids naturally biosynthesized in Cannabis (marked in green) with uridine diphosphate glucose (UDP-Gle) or acyl-CoAs in the presence of HuCoAT5, HuCBGT1 or HuCBGT6 enzymes from H. umbraculigerum (represented by blue). AAE, acyl activating enzyme; OLS, olivetol synthase; OAC, olivetolic acid cyclase; GOT, geranylpyrophosphate: olivetolate geranyltransferase; CBDAS, cannabidiolic acid synthase; CBCAS, cannabichromenic acid synthase; THCAS, (−)-Δ⁹-trans-tetrahydrocannabinolic acid synthase; AAE, acyl activating enzyme; PT, prenyl-transferase; UGT, uridine diphosphate-glycosyltransferase; AAT, alcohol acyl-transferase. The active enzymes identified in this study are marked by their names. CoAT, acyl-CoA-transferase; TKS, tetraketide synthase; PKC, polyketide cyclase; CBGAS, cannabigerolic acid synthase; OAGT, olivetolic acid UGT; CBGT, cannabinoid UGT; CBAT, cannabinoid acyl-transferase; BBE-like, berberine bridge enzyme-like; Cyc, cyclase; CYP, cytochrome P450.

FIGS. 7A-7B include chromatograms and structures of chemical compounds showing LC-MS/MS fingerprinting of CBGA 1, heliCBGA 2 and APHA 3 in H. umbraculigerum. (7A) Extracted ion chromatograms and MS/MS spectral matching of cannabigerolic acid (CBGA 1 [M−H]⁻=359.222 Da), heli-cannabigerolic acid (heliCBGA 2 [M−H]⁻=393.206 Da), and pre-amorphastilbol (APHA 3 [M−H]⁻=391.191 Da) standards or authentic metabolites versus a H. umbraculigerum leaf extract. To confirm the assignment, CBGA 1 and heliCBGA 2 were purified and analyzed by NMR. (7B) Stable isotope labeling of CBGA 1, heliCBGA 2 and APHA 3 via feeding of H. umbraculigerum leaves with hexanoic-D₁₁acid, phenylalanine-D₅or phenylalanine-¹³C₉. The MS/MS spectra of the non-labeled versus the labeled forms show similar fragmentation patterns with mass shifts corresponding with the labeled parts of the molecule.

FIGS. 8A-8J include micrographs and images showing stalked glandular trichomes in leaves and flowers of H. umbraculigerum. (8A-8B) Representative cryo-SEM micrographs of the lateral view of flower samples showing stalked glandular trichomes (marked by arrows). (8C) Light micrograph showing the biseriate structure of stalked glandular trichomes of H. umbraculigerum leaves. (8D-8F) Selected TEM micrographs of trichomes of H. umbraculigerum leaves at different stages of secretion. High magnification images show the ultrastructure of disk cells (DCs). CW, cell wall; M, mitochondria; N, nucleus; P, plastid; PSP, periplasmic space; SCv, secretory cavity; V, vacuole; Vs, vesicle. Arrows mark active secretions from the vesicles to the PSP by exocytosis. (8D) In the presecretory stage, DCs contained a very dense cytoplasm covered by ER and multiple ribosomes. There was no SCv or PSP and plastids were large and resembled pro-plastids. (8E) In the secretory stage, delamination of the apical DC wall led to the formation of the SCv. Electron transparent secretions were exuded out of plastids in vesicles delimited by an electron-dense layer. The vesicles released their contents to the PSP by exocytosis where the secretory product accumulated prior to secretion into the SCv. (8F) DCs of mature trichomes at the post-secretion stage were largely vacuolated with a cytoplasm restricted to the small remaining area. Plastids at this stage had degenerated and no vesicles were observed. The cell wall had a largely cutinized layer with a large SCv. MALDI-MSI of m/z 361.23±0.01 Da signals of the (8G) abaxial and (8H) adaxial leaf domains, following partial removal of trichomes by duct tape (the peeled area is outlined by green line). The areas with partially/fully removed trichomes show less or no signals compared to the untouched parts. (8I) Optical image and (8J) MALDI-MSI of m/z 361.23±0.01 Da of a cross-sectioned flower receptacle. Glandular trichomes in i are marked to improve interpretation. The signals in 8G-8H, and 8J. correspond with the protonated m/z of CBGA 1 and geranylphlorocaprophenone 4. The white broken lines in 8G-8J. mark the regions analyzed.

FIG. 9 include a scheme showing the predicted parallel metabolic pathways for the biosynthesis of cannabinoids and other terpenophenols present in H. umbraculigerum. The predicted types of enzymes catalyzing each reaction are marked by 1-8. Additional functional groups and rearrangements include hydroxylation, double bond isomerization or reduction, cyclization, and others. Alkyl chains can be linear/branched with one to seven carbons length; AAE, acyl activating enzyme; PKS, type III polyketide synthase; PKC, polyketide cyclase; PT, prenyl-transferase; UGT, uridine diphosphate-glycosyltransferase; AAT, alcohol acyl transferase; DBR, double bond reductase; CHI, chalcone isomerase. The active enzymes identified in this study are marked by their names. CoAT, acyl-CoA-transferase; TKS, tetraketide synthase; CBGAS, cannabigerolic acid synthase; OAGT, olivetolic acid UGT; CBGT, cannabinoid UGT; CBAT, cannabinoid acyl-transferase.

FIGS. 10A-10E include chromatograms, a scheme, structures of chemical compounds, and curves showing functional characterization of HuAAE, HuPKS and HuPTs. (10A) Ion abundances from triple-Quad analyses of acyl-CoAs produced in vitro by the HuAAEs versus analytical standard (Std). (10B) A scheme showing the steps and types of products and by-products synthesized in vitro by the recombinant HuPKSs with or without the Cannabis olivetolic acid cyclase (CsOAC). (10C) Ion abundances from triple-Quad analyses of OA 92 and olivetol products from coupled recombinant enzyme assays of HuPKSs with either an empty vector (EV) or Cannabis olivetolic acid cyclase (CsOAC), in the presence of hexanoyl-CoA and malonyl-CoA. (10D) MS/MS spectra of prenylated OA 92 products with cannabigerolic acid synthase (HuCBGAS4) and either isopentenyl pyrophosphate (IPP), geranyl pyrophosphate (GPP) or farnesyl pyrophosphate (FPP) as the prenyl donors. CBPA 19, cannabiprenylic acid; CBGA 1, cannabigerolic acid; SesquiCBGA, sesqui cannabigerolic acid (MS/MS spectrum corresponds to published data from Cannabis¹⁵). (10E) Steady state kinetic analysis of H. umbraculigerum prenyl-transferases HuPT1, HuPT3 and HuCBGAS4 with OA 92 and GPP. The Michaelis-Menten Km value of each enzyme was calculated using varying (0.5 μM-3 mM) and constant (1 mM) concentrations of each substrate (n=3 technically independent samples; measurements were plotted individually).

FIGS. 11A-11D include phylogenetic trees showing phylogenetic analyses of enzymes and whole proteome from H. umbraculigerum and different plant species. Phylogenetic analysis of (11A) AAE, (11B) PKS and (11C) PT proteins from H. umbraculigerum and other plants. H. umbraculigerum and Cannabis proteins are highlighted in red and blue, respectively, and the active enzymes were marked by a flower and a leaf, respectively. A full list of protein IDs is available in Berman et al., “Parallel evolution of cannabinoid biosynthesis”; Nature Plants 9 817-831 (2023). Bootstrap values are indicated at the nodes of each branch. (11A) The selection of the proteins was based on (11A) Arabidopsis thaliana enzymes or (11B-11C) functionally tested enzymes. Clades according to substrates or functionalities are marked by different colors. None of the active H. umbraculigerum enzymes clustered with any of the known Cannabis proteins. (11D) phylogenetic relationship between Arabidopsis thaliana, Solanum lycopersicum, Helianthus annuus, Letuca sativa, Cannabis sativa and Helicrysum umbraculigerum illustrate the evolutionary distance between the last two species (marked by a flower and a leaf, respectively). The tree was constructed based on the whole proteomes of each species using the word-based software Prot-SpaM.

FIGS. 12A-12C include graphs, chromatograms, structures of chemical compounds, and curves showing functional characterization of HuUGTs. (12A) Activities of lysates containing HuUGTs with olivetolic acid (OA 92), cannabigerolic acid (CBGA 1) and helicannabigerolic acid (heliCBGA 2) as substrates and uridine diphosphate glucose (UDP-Glc) as the sugar donor (n=1). Reactions show differing substrate specificities and type of products. Representative peaks correspond to chromatograms obtained for HuCBUGT1. The most abundant products in each assay are marked with asterisks. EV, empty vector. (12B) In vitro production of monoglucosides with the purified UGTs and additional substrates. Extracted ion chromatograms of the observed monoglucosides using UDP-Glc and either DHSA 93, olivetol, CBG, CBD, A9-THC, PCP 95, naringenin chalcone 97 or pinocembrin chalcone 100. The substrates naringenin chalcone 97 and pinocembrin chalcone 100 contained mixtures of the chalcones and respective flavanones. All LC-MS chromatograms were selected for the theoretical m/z values of the respective metabolites of interest. (12C) Comparison of steady state kinetics of UGTs with OA 92 and UDP-Glc. HuOAUGT11 and HuUGT13 were compared with UGTs from rice (OsUGT) and stevia (SrUGT). Kinetic values were calculated using varying (0.5 Mm-3 mM) and constant (1 mM) concentrations of each substrate (n=3 technically independent samples; measurements were plotted individually). V₀and Vmax were calculated using the calibration curve of OA 92 since there was no analytical standard available for Glc-OA 102.

FIGS. 13A-13C include structures of chemical compounds, chromatograms, and a phylogenetic tree showing functional characterization of HuAATs. (13A) Stable dual isotope labeling of O-MeButCBGA 120 via feeding of H. umbraculigerum leaves with either 2-methyl butyric-D₉acid or hexanoic-D₁₁acid. The MS/MS spectra of the non-labeled versus the two-labeled forms show fragmentation patterns with mass shifts corresponding with the labeled parts of the molecule. Fragments colored in red, or purple correspond to the m/z of the specific fragment with labeled alkyl chain or acyl group, respectively. (13B) Activities of lysates containing HuAATs with different acyl donors and cannabinoid acceptors. Extracted ion chromatograms were selected for the theoretical m/z values of the respective metabolites. Only HuCBAT5 and HuAAT14 (red and blue, respectively) acylated CBGA 1 and heliCBGA 2 with both acyl-CoAs. EV, empty vector; Std, standard; ButCoA, butyryl-CoA; HexCoA, hexanoyl-CoA. (13C) Phylogenetic analysis of HuAAT proteins and identified BAHD AATs from other plants. The Maximum Likelihood tree was constructed with 100 bootstrap tests based on a MUSCLE multiple alignment using the MEGA11 software. The evolutionary distances were computed using the JTTmatrix-based method. Bootstrap values are indicated at the nodes of each branch. The clades of the different AAT types are marked in circles based on Tuominen et al. (2011). The active HuCBAT5 and HuAAT14 were clustered in clade IIIa which represents BAHDs of diverse catalytic functions. A full list of protein IDs is available in Berman et al., “Parallel evolution of cannabinoid biosynthesis”; Nature Plants 9 817-831 (2023).

FIG. 14 includes chromatograms and structure of chemical compounds showing MS/MS spectra of observed acylated cannabinoids following enzymatic assays with the purified HuCBAT5. OA 92, olivetolic acid; CBGA 1, cannabigerolic acid; HeliCBGA 2, helicannabigerolic acid; CBDA, cannabidiolic acid. Full data of MS/MS products appears in Berman et al., “Parallel evolution of cannabinoid biosynthesis”; Nature Plants 9 817-831 (2023). MS/MS fragmentation and retention times correspond to the O-acylated cannabinoids found in the plant.

FIGS. 15A-15F include schemes, chromatograms, and a table showing the reconstruction of the core cannabinoid pathway in heterologous systems. Schematic representation of products observed in (15A) N. benthamiana leaves and (15D) S. cerevisiae yeasts following co-expression of different combinations of HuCoAT6, HuTKS4, and HuCBGAS4, along with CsOAC from Cannabis. NbUGT, N. benthamiana uridine diphosphate-glycosyltransferase; HexNa, sodium hexanoate; GPP, geranyl pyrophosphate; OA 92, olivetolic acid. Extracted ion chromatograms and MS/MS spectra showing (15B) glycosylated OA (Glc-OA 102), glycosylated polycaprophenone (Glc-PCP1/2) and glycosylated naringenin chalcone (Glc-Naringenin chalcone 1/2) following feeding with HexNa and GPP (I); and (15C) glycosylated cannabigerolic acid (Glc-CBGA 109) following feeding with OA 92 and GPP (II). Glycosylated metabolites synthesized by the recombinant stevia (SrUGT) or rice (OsUGT) enzymes were used as reference for identification of N. benthamiana products according to exact mass, retention time and MS/MS spectra. EV, empty vector; UDP-Glc, uridine diphosphate glucose. (15E) Extracted ion chromatograms of OA 92, PCP 95 and CBGA 1 products observed in yeasts without any feeding. Identification was according to analytical standards. (15F) Summary of the observed products in each assay. PDAL, pentyl acyl diacetic acid lactone; HTAL, hexanoyl acyl triacetic acid lactone.

DETAILED DESCRIPTION

The present invention, in some embodiments, is directed to a DNA molecule comprising at least a first nucleic acid sequence encoding a first protein and at least a second nucleic acid sequence encoding a second protein, wherein the first protein and the second protein are derived from Helichrysum umbraculigerum, including methods of using same.

In some embodiments, any one of the first protein and the second protein belongs to an enzyme family selected from: acyl activating enzyme (AAE), polyketide synthase (PKS), polyketide cyclase (PKC), prenyltransferase (PT), cannabichromenic acid synthase (CBCAS), uridine diphosphate (UDP)-glycosyltransferase (UGT), alcohol acyltransferase (AAT).

In some embodiments, the DNA molecule further comprises at least a third nucleic acid sequence encoding a third protein derived from H. umbraculigerum and belonging to an enzyme family selected from: AAE, PKS, PKC, PT, CBCAS, UGT, and AAT.

In some embodiments, the DNA molecule further comprises at least a fourth nucleic acid sequence encoding a third protein derived from H. umbraculigerum and belonging to an enzyme family selected from: AAE, PKS, PKC, PT, CBCAS, UGT, and AAT.

In some embodiments, the DNA molecule further comprises at least a fifth nucleic acid sequence encoding a third protein derived from H. umbraculigerum and belonging to an enzyme family selected from: AAE, PKS, PKC, PT, CBCAS, UGT, and AAT.

In some embodiments, the DNA molecule further comprises at least a sixth nucleic acid sequence encoding a third protein derived from H. umbraculigerum and belonging to an enzyme family selected from: AAE, PKS, PKC, PT, CBCAS, UGT, and AAT.

In some embodiments, the DNA molecule further comprises at least a seventh nucleic acid sequence encoding a third protein derived from H. umbraculigerum and belonging to an enzyme family selected from: AAE, PKS, PKC, PT, CBCAS, UGT, and AAT.

In some embodiments, the first protein and the second protein belong to different enzyme families.

In some embodiments, the first protein, the second protein, and the third protein belong to different enzyme families.

In some embodiments, the first protein, the second protein, the third protein, and the fourth protein belong to different enzyme families.

In some embodiments, the first protein, the second protein, the third protein, the fourth protein, and the fifth protein belong to different enzyme families.

In some embodiments, the first protein, the second protein, the third protein, the fourth protein, the fifth protein, and the sixth protein belong to different enzyme families.

In some embodiments, the first protein, the second protein, the third protein, the fourth protein, the fifth protein, the sixth protein, and the seventh protein belong to different enzyme families.

According to some embodiments: (a) an AAE protein is encoded by a nucleic acid sequence having at least 89% homology or identity to any one of SEQ ID Nos.: 1-11; (b) PKS is encoded by a nucleic acid sequence having at least 83% homology or identity to SEQ ID Nos.: 23-26; (c) PKC is encoded by a nucleic acid sequence having at least 88% homology or identity to SEQ ID Nos.: 31-38; (d) PT is encoded by a nucleic acid sequence having at least 91% homology or identity to SEQ ID Nos.: 47-58; (e) CBCAS is encoded by a nucleic acid sequence having at least 82% homology or identity to SEQ ID Nos.: 71-79; or (f) any combination of (a) to (e).

In some embodiments, the DNA molecule further comprises a nucleic acid sequence being derived from Helichrysum umbraculigerum and encoding one or more protein(s) or enzyme(s) belonging to the uridine diphosphate (UDP)-glycosyltransferase (UGT) family; the alcohol acyltransferase (AAT) family, or both.

In some embodiments: (a) UGT is encoded by a nucleic acid sequence having at least 87% homology to any one of: SEQ ID Nos.: 89-101, and any combination thereof; (b) AAT is encoded by a nucleic acid sequence having at least 87% homology to any one of: SEQ ID Nos.: 115-129, and any combination thereof; or (c) both (a) and (b).

In some embodiments, the DNA molecule comprises at least two nucleic acid sequence encoding at least two enzyme, wherein each enzyme belongs to a different family, wherein the at least two families are selected from: AAE, PKS, PKC, PT, CBCAS, UGT, and AAT.

In some embodiments, the DNA molecule is an isolated DNA molecule. In some embodiments, the DNA molecule is a complementary DNA (cDNA) molecule.

As used herein, the term “DNA molecule” refers to a polynucleotide comprising or consisting of deoxyribonucleotides.

As used herein, the terms “isolated polynucleotide” and “isolated DNA molecule” refer to a nucleic acid molecule that is essentially free from contaminating cellular components, such as carbohydrate, lipid, or other proteinaceous impurities associated with the nucleic acid in nature. Typically, a preparation of isolated DNA or RNA contains the nucleic acid in a highly purified form, e.g., at least about 80% pure, at least about 90% pure, at least about 95% pure, greater than 95% pure, or greater than 99% pure. In some embodiments, the isolated polynucleotide is any one of DNA, RNA, and cDNA. In some embodiments, the isolated polynucleotide is a synthesized polynucleotide. Synthesis of polynucleotides is well known in the art and may be performed, for example, by ligating or covalently linking by primer linkers multiple nucleic acid molecules together.

The term “nucleic acid” is well known in the art of molecular biology. A “nucleic acid” as used herein will generally refer to any molecule (e.g., a strand) of DNA, RNA or a derivative or analog thereof, comprising nucleotides. Nucleotides are comprised of nucleosides and phosphate groups. The nitrogenous bases of nucleosides include, for example, naturally occurring purine or pyrimidine nucleosides as found in DNA (e.g., an adenine “A,” a guanine “G,” a thymine “T” or a cytosine “C”) or RNA (e.g., an A, a G, an uracil “U” or a C).

The term “nucleic acid molecule” includes but is not limited to single-stranded RNA (ssRNA), double-stranded RNA (dsRNA), single-stranded DNA (ssDNA), double-stranded DNA (dsDNA), small RNAs, circular nucleic acids, fragments of genomic DNA or RNA, degraded nucleic acids, amplification products, modified nucleic acids, plasmid or organellar nucleic acids, and artificial nucleic acids such as oligonucleotides.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 1)

ATGACGTCGTCAAAGAAGTTTACAGTTGAAGTTGAACCGGCGATTCCGGC

CAAGGATGGAAAACCGTCGGCTGGACCGGTTTACCGTAGTATCTTTGCTA

AAGACGGTTTTCCAGCTCATATTGACGGTTTAGATTCATGTTGGGATATT

TTCCGCCTATCTGTGGAGAAATACCCCAATAATCGAATGCTTGGCACCCG

TGAATTTGTGAATGGAAAGCATGGACCATATGTATGGTCGACTTACAAAC

AAGTATACGACAAGGTGATAAAGGTTGGAAATGCTATCCGTGCGTGTGGT

GTCGAGCCAGGTGGTCGGTGTGGGATCTATGGTGCCAATTGTGCAGAATG

GATTATGAGCATGGAGGCATGTAATGCTCATGGGCTTTACTGTGTACCTT

TATACGATACCTTAGGTGCTGGTGCAATTGAATTCATTCTTTGCCATGCC

GAGGTTACAATTGCTTTTGTAGAAGAGAAAAAGATCCCTGAGTTGTTGAA

AACATTTCCGAAAGCTGGAGAATTTCTGAAAACAATTGTGAGCTTTGGAA

AAGTTACTCCTGAACAAAGAGAACAAGCTGAAAACTTTGGTTTAAAAATA

CATTCATGGGATGAATTCTTGACATTGGGTGATGATAAAAACTTTGACCT

GCCACTGAAGGAAAAAACTGATATCTGTACAATAATGTACACTAGTGGAA

CAACTGGTGATCCTAAGGGTGTTCTGATTTCAAATAACAGCATGGCAACA

CTTATAGCTGGCGTCAATCGTCTACTAGATAGTGCAAAAGAATCTTTGAA

TCAACATGATGTCTATCTCTCGTTTTTACCTCTGGCACATATATTTGACC

GTGTGATTGAAGAATGTTTTATCAATCATGGAGCATCTATAGGATTCTGG

CGTGGGGATGTTAAATTGCTGATTGAAGACATAGGGGAGCTGAAACCTAC

TATTTTCTGCGCTGTTCCTCGAGTGTTGGATAGGATTTATTCAGGTTTGC

AACAGAAAATTTCTGCGGGGGGTTTTATCAAACGTAACTTATTTAATCTA

GCCTATTCATACAAATTACGTAATATGAAGGGAGGGAAAACACATTCAGA

GGCATCTCCATTGAGTGACAAAATCGTCTTCAGTAAGGTTAAGCAGGGCC

TAGGAGGAAATGTACGAATTATTCTATCTGGAGCTGCTCCACTAGCTCCA

CATGTAGAAGCTTACCTGAAAGTAGTGGCATGTAGTCACGTCCTGCAAGG

ATATGGCCTGACAGAAACTTGTGCTGGATCATTTGTCTCACTGCCAAACG

AAATGGAGATGCTGGGTACAGTGGGCCCACCTGTACCAGTTTTGGATGCC

CGACTGGAGTCTGTTCCGGAGATGAACTATGATGCTTGTTCAAGCAAACC

ACAAGGAGAAATATGTATTAGAGGGGATGTTCTGTTTTCAGGATACTACA

AGCGTGAGGACCTTACAAAAGAAGTCTTTGTTGATGGGTGGTTCCATACA

GGTGATATCGGTGAGTGGCAACCAGATGGAAGCATGAAAATTATTGACCG

AAAGAAAAACATTTTTAAGCTCTCACAAGGAGAGTACGTCGCAGTTGAAA

ATCTGGAGAATGTTTATGGAAATGTTTCTGACATTGACACGATATGGATA

TATGGGAACAGCTTCGAGTTTTGTCTTGTTGCTGTGGTCAACCCAAATGA

GCCAGCAATCAAACGTTATGCTGAAGCAAATAATATTTCTGGGGATTTTG

ATTCATTATGTGAAAATCCCAAAATTAAAGAATACATACTCGGAGAGCTC

GCTAGAATTGGAAAAGAGAAAAAGTTAAAAGGTTTTGAATTCGTCAAAGC

TGTTCACCTTGACCCTGTCCCTTTCGACATGGAACGTGACCTTCTGACCC

CAACATTCAAGAAGAAAAGGCCCCAGATGCTTAAGTACTACCAGGATGTA

ATTGATAACATGTACAAGACTATTAACAAGAAGTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 89%, at least 92%, at least 95%, or at least 97% homology or identity to SEQ ID NO: 1, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 89% to 95%, 90% to 97%, 95% to 99%, or 90% to 100% homology or identity to SEQ ID NO: 1. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 2)

ATGGATGCATTGAGGAAGCCTAATTCTGCGAATTCAAGCCCTTTAACTCC

TATCGGATTCCTTGAAAGGGCAGCCGTCGTATTTGCCAACTCTCCTTCGA

TCGTATACAACAATCTCATCTACACTTGGAGCGATACTTTTCATCGTTGT

CTACGATTAGCTTCATCCATCTCTCGTCTCGCTATACGAAAAGGCGACGT

TGTTTCAGTACTCGCACCAAACATCCCTGCCATTTATGAGCTTCATTTTG

GCATCACTATGACTGGGGCCATAATCAACACCATCAATACCCGTTTGGAT

GCGCGTACTATCTCAATACTCCTTTGTCACAGTGAATCCAAGCTCGTCTT

TGTTGATTACCAGTTGACTCGTCTTATACGAGAAGCGGTTTCTTTGATGC

CAGATGCTTGTGTTCCCCCACAACTCGTCCTCATCGTAGATGACGGACAT

AATCTATCTTTACTTTCTGATCAATTTATCAATACTTATGAAGCTATGGT

TGAAACAGGGGATCCTGGGTTCAATTGGGTTCGTCCAGATAGCGATTGGG

ACCCTCTAACGTTGAATTACACTTCTGGGACGACTTCTTCCCCCAAAGGT

GTTGTTAACAGCCACCGTGGATCGTTCATAGTAGCGTTTGATTCTTTACT

GGAGTGGCACGTACCGAAACAGCCGATCATGCTGTGGACTCTACCAATGT

TCCACGCAAATGGGTGGAGCTTCGTTTGGGGTATGGCAGCTGTTGGTGGC

ACCAATGTTTGCCTTCGTAAATTCGATGCTACTATTATTTATGACACCAT

TCGTAACCACCATGTGACGCACATGTGTGGCGCCCCTGTTGTACTCAACA

TGTTATCAGAAGGTAAGCCACTTGAACACACGGTTCACATAATGACAGCA

GGAGCACCACCTCCAGCGGCCGTTTTGTTGCGAACCGAGTCGCTAGGGTT

TGAGGTGACTCATGGGTTCGGGATGACAGAAACAGGCGGGTTAGTTGTGT

CATGCTCATGGAAGAAAGAATGGAATCGTCTGCCCGTGACTGAGAAAGCG

AGATTGAAAGCGAGACAAGGAGTTAGAACACTTGGGATGACGGAAGTGGA

TATTGTGGATCCCGAGTCAGGAGTAAGTGTGACTCGAGACGGGTTAACTC

AGGGGGAATTAGTGTTGCGAGGTGGGTCTATTATGTTGGGTTACTTAAAA

GATCCGGAAACAACAAATAAATCCGTTAAAAACGGGTGGTTTTATACCGG

CGACGTGGCGGTGATGCATCCAGATGGATATCTGGAAATAAAAGATAGAT

CAAAAGATGTAATAATAAGTGGTGGTGAGAATATAAGTAGTGTGGAGGTT

GAGTCAATCTTGTATCAGCATCCTGCGATTAACGAGGCCGCGGTGGTGGG

ACGGCCTGATGAGTTTTGGGGCGAGTCGCCGTGTGCTTTCGTGAGTTTGA

AAGATGATAACGGGAAGGTGGCTGTGCCAACAGCGGATGAGATAATGAAG

TTTTGTAAAGGAAAGTTGCCGGGTTACATGGTACCCAAATCGGTTGTGTT

TAAGAAGGATCTTCCGAAGACATCTACCGGTAAGATTCAGAAATATGTGC

TTAGAAAACTTGCTAAAGATTTGGGTTTTGCTGTAAAAAGTCGAATTTA

G.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 79%, at least 83%, at least 87%, at least 89%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 2, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 79% to 85%, 80% to 92%, 82% to 99%, or 80% to 100% homology or identity to SEQ ID NO: 2. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 3)

ATGACCGAAGAGGAAAAAAATAAAGCAGAGTCCATGGGGATAAAAACGTA

TGCATGGAGCGACTTCCTTCATCTGGGGAGTAAAAATCCTTCAGAACTGC

AAACGCCTAAAGCAACTGATATATGTACAATCATGTACACTAGTGGCACT

AGTGGAGACCCAAAAGGTGTTATATTGACACATGAAAATGCTACAACAAA

CATACGAGGGGTTGATCTTTTCATGGAACAATTCGAGGACAAGATGACCG

TGGATGACGTTTATATATCTTTCTTGCCTCTTGCTCACATTCTTGATCGT

ATGATTGAAGAATACTTTTTCCGTAGTGGTGCCTCTGTCGGCTTCTATCA

TGGGGATATCAATGCGTTGAAGGAGGATTTGGCAGAGCTAAAGCCTACTT

TTTTGGCTGGAGTACCTCGAGTTTTGGAAAAGATTCACGAAGGTGTGCTT

AAAGGACTAGAAGAAGTTAATCCAAGGAGAAGGAAAATATTTAGCATTTT

ATACAATCACAAACTAAAATACATGAAAGCAGGTTACAAGCATAAATATG

CATCACCACTTGCAGATCTGCTTGCTTTTAGAAAGGTTAAGAACAGGCTT

GGTGGGCGAATTCGTCTTATGGTATCTGGAGGAGCTCCGTTAAGCACTGA

GATTGAAGAGTTCATGAGGGTTACTTCATGTGCTTTTGTGGCGCAAGGAT

ATGGTTTGACGGAAACATGTGGTTTGGCTACTTTAGGATTTCCAGATGAG

ATGTGCATGATTGGAACAGTTGGTTCGCCCTTCGTGTATACAGAATTACG

CCTCGAAGAAGTTTCAGATATGGGCTATGACCCGTTGGCCAATCCACCAC

GTGGTGAAATATGTGTTAAGGGAAAAACGCCTTTCGCAGGTTACTACAAG

AATCCAGAACTCACTAATGAGGTCATGAAAGATGGGTGGTTTCATACAGG

TGACATAGGAGAGATGCAACCAAACGGGGTATTGAAAATCATCGACAGAA

AGAAACATCTGATAAAACTATCTCAAGGGGAGTATATCGCGCTTGAATAT

CTAGAGAAAGTTTACTGCATCACTCCCATTCTTGAAGACATCTGGGTATA

TGGGGATAGCTTCAAGTCATCATTGGTCGCGGTAGCTGTACCAAACAAAG

AAAACGCAGAAAAGTGGGCCGATCAAAAGGGCCTTAAAGTTTCTTACTCT

GAGCTCTGCACACTAACACAGTTCAGAGATTATATCCAATCTGAACTGAA

ATCTACCGCGGAGAGAAACAAGCTAAGAGGTTTTGAGCATATAAAGGCTA

TAATTGTGGAGCCACGGACGTTTGAAGGAGACCAGGAATTGTTGACTGCA

ACAATGAAGAAACGTAGAAATAAACTGCTTAACCGTTACAAGGAGGGGAT

CGACAACCTTTACAAGAACTTGGCTGCAAACAAACGCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 86%, at least 88%, at least 90%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 3, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 86% to 94%, 88% to 97%, 86% to 100%, or 92% to 99% homology or identity to SEQ ID NO: 3. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 4)

ATGGTGTACAAGTCTTTGAATTCAATATCCATATCAGATATAGTAAATCT

TGGTATATCACCTGAAACTGCAACTCAACTTCATCAGAAACTAACTGAAA

TCATTCAGATTTATGGTTTTGATGCTCCTCAAACATGGACCCAGATATCC

ACCCGGATTCTTCATCCGGACCTTCCCTTTTGTTTTCATCAGATGATGTA

TTATGGATGCTATGTTGATTTTGGACCGGATCCTCCTGCTTGGTCACCCG

ACCCGAAGGATGCAAAGTTAACAAACATAGGTAGTTTATTAGAGAGACGC

GGAAAGGAGTTCTTGGGGCCTAGTTATAAAGATCCCATTTCAAGCTACTC

TGCTCTTCAGGAATTTTCAGCCTTAAATCTAGAGGTGTTTTGGAAAACAA

TATTGGATGAAATGAATATAACATTTTCTGTGCCTCCAAAACGCATATTA

GTTGATGACCTGTCTAAAGAAAGCCAGTTATTGCATCCAGGTGGTCGATG

GCTTCCCGGAGCTTATGTAAATCCAGCTAGAAATTGTTTGAGTTTAAGTA

GCAAGAGAAGGTTAAGTGATATAGCAGTTATATGGCGTGATGAAGGAAAT

GATGATATGCCGGTCAACAAAATGACGTTTCAGCAGTTGCGCTCAGAGGT

TTGGTTAGTTGCATATGCACTTGATACATTGGGAGTGGAAAAAGGATCTG

CAATTGCAATCGATATGCCTATGGATGTCAAATCTGTGGTGATTTATCTA

GCCATTGTTTTAGCAGGCTATGTGGTTGTATCTATTGCAGATAGTTTTGC

TGCTGGTGAAATTTCGACCAGACTTGTATTATCAAAAGCAAAAGCAATTT

TTACTCAGGATTTGATCATTCGTGGTGACAGAAGCCATCCCTTGTACAGC

CGAGTTGTTGATGCTCAATCACCTCTAGCAATTGTCATTCCTACGAGAGG

CTCAAGTTTTAGTATAAAATTACGTGACGGTGATATTTCTTGGCATGATT

TTCTGGAACGAGCTAACACTTACAGGAATGTTGAGTTTGTTGCTGTTGAA

CGACCCGTTGAAGCTTTCTCAAATATCCTTTTCTCATCAGGAACTACAGG

GGAACCGAAGGCAATTCCATGGACCCTTGCAACACCTTTCAAGGCTGGTG

CAGACGCTTGGTGCCACATGGATGTCCACAAAGGTGATGTTGTTGCATGG

CCTACTAATCTTGGATGGATGATGGGTCCTTGGCTAATATATGCTTCATT

GTTAAATGGGGGCTCACTTGCATTATACAACGGATCTCCCCTGACTTCTG

GATTTGCCAAGTTTGTTCAGGATGCAAAAGTAACATTGTTGGGAGTGATA

CCAAGTATTGTGAGGGCATGGAGAACAAACAATAGTACAGCCGGCTTTGA

CTGGTCAACCATCCGGTGCTTTGGATCGACCGGTGAGGCCTCTAATACTG

ATGAATGTCTTTGGCTGATGGGAAGAGCTCATTACAAACCGGTCATCGAG

TATTGCGGTGGCACAGAGATTGGTGGTGGTTTTATTACAGGATCTTTACT

GCAGCCTCAGTGTTTGTCTGCTTTCAGCACACCAAGTTTGGGTTGTAAAC

TGTTAATTCTTGGCGAAGATGGAATCCCTATACCACAAAACGCTCCTGGA

ATTGGTGAATTGGCTCTGAATCCCCTCATGTTTGGGGCATCGAGCACACT

ACTAAATGCAAACCACTATGATGTCTACTTTAAAGGCATGCCCTCTTGGA

ATGGTAAGGTTCTAAGAAGGCATGGAGATGTATTTGAGCGCACGTCTAAA

GGATACTATCGTGCCCATGGTCGTGCAGATGATACTATGAATCTTGGGGG

TATTAAGGTAAGTTCGGTTGAGATTGAACGTGTATGCAACTCGATTGATG

ACAGAATTCTCGAGACAGCGGCTATAGGGGTTACACCTTCTGGTGGCGGG

CCAGAGAGGTTGGTAATTGTTGTTGCTTTTAAAGATGGCAGTGGTTCGAA

ACCCGACTTAATCAAGTTGAAGGTCACACTGAATTCAGCTTTACAAAAGA

ATCTGAACCCTTTGTTTAAGGTTTCTGATGTGGTGCCCTTTCCATCACTT

CCTAGGACAGCAACAAACAAGGTAATGAGAAGGGTTTTGCGACAGCAGTT

GACTCAAATTGGTCAAAATAGCAAGCTATAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 88%, at least 90%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 4, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 88% to 95%, 89% to 99%, 91 to 98%, or 88% to 100% homology or identity to SEQ ID NO: 4. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 5)

ATGGGTGATTCAGAGGGAAGCAGCATTAGTACTCCTACAACTGAACAAGT

TGGTTTCTTGTCAAATATCATGGAAGACAAATCTTATAGTGCTGCAGTTG

CAATTATGGTTGCCATTGCTGTACCGTTGGTTCTTTCTTCAGTGTTTGCA

GCGAAGAAGAAAGTGAAACAACGAGGCGTTCCCGTTCAAGTTGGTGGTGA

GCCAGGTTTTGCCATGCGTAACTCTAGATCAAACAAATTAGTTGATGTCC

CATGGGAAGGAGCTAGAACAATGGCTGCTCTTTTTGAGCAGTCTTGTAAG

AAGCATTCACAGCTTCGGTTTCTTGGTACAAGGAAGTTGATTGAAAGAAG

CTTTGTGAGTGGTAGTGATGGGAGAAAATTCGAGAAGTTACATCTTGGGG

AGTATCAGTGGGAGACATATGGGCAGATATTTGAACGTGTTTGCAACTTT

GCATCTGGACTTATTCAGCTTGGTCATGACCCTGATACTCGTATTGCCAT

CTTTTCTGACACACGAGCTGAATGGTTAATTGCATTTGAGGGATGCTTCA

GGCAGAACATCACTGTGGTTACCATATATGCATCATTAGGTGATGATGCC

CTCATTCACTCTCTTAACGAGACTAAAGTATCGACCTTGATTTGTGATTC

CAAACTATTGAAAAAAGTGGCTGCAGTTAGTTCAAGCCTGAAAACTGTAG

AAAACTTCATCTACTTTGAAAGTGACAACACTGAAGCTTTAAATGAAATC

GGTGATTGGAAAATATCTTCTTTTTCTGAAGTCGAGAGCTTGGGACAGAA

GAGTCCAGTAAGTGCTAGACTGCCTATCAAGAAAGACGTTGCAGTGATCA

TGTATACAAGTGGCAGCACAGGTTTACCAAAGGGGGTGATGATGACTCAT

GGGAATGTAGTAGCAACTGCAGCTGCGGTTATGACTGTAATCCCAAATAT

TGGGACCAATGATGTTTATCTGGCATACTTACCATTGGCTCATATTTTCG

AGTTGGCTGCTGAGACTGTGATGGTAACTGCAGGTATTCCAATTGGTTAT

GGTTCAGCACTCACTTTAACAGACACATCAAATAAAATCAAGAAAGGAAC

CTTGGGAGATGCATCCATCTTGAAGCCAACGTTAATGGCAGCTGTTCCAG

CTATTTTAGATCGTGTCCGAGATGGAGTATTAAAGAAGGTTGAGGAAAAG

GGAGGTTTGACAACAAAAATATTCAATATAGCCTACAAAAGGCGTTTGCT

AGCAGTAGATGGAAGTTGGCTGGGTGCATGGGGGTTAGAGAAGCTATTGT

GGGATGCCATTGTTTTTAAGAAGATTCGTTCTGTACTTGGAGGAGATATC

CGTTTCATGCTCTGTGGTGGTGCTCCTTTAGCTGCAGATACTCAGCGATT

TATAAATGTCTGCGTTGGGGCTCCAATTGGACAAGGATATGGGCTGACCG

AAACATGCGCTGGAGCTGCTTTCTCTGAGGCAGATGATAATTCTGTTGGG

CGTGTTGGTCCACCACTTCCTTGTGTCTATATTAAACTTGTTTCATGGGA

TGAAGGTGGGTATTTAACATCAGACAAACCAATGCCGCGAGGCGAAGTTG

TAGTTGGTGGGTACAGTGTAACCGCTGGTTACTTTAATAATGAGGAAAAG

ACCAATGAGGTTTACAAGGTTGATGAAAGTGGGATGCGTTGGTTCTACAC

TGGGGACATTGGAAGGTTTCATCCTGATGGATGCCTTGAAATCATTGACA

GGAAGAAGGATATTGTAAAACTTCAACATGGAGAGTACATCTCCTTGGGG

AAGGTTGAGGCAGCACTTGCGTCAAGCAAGTATGTAGAGAATGTAATGTT

ACATGCCGACCCCTTCCACACTTATTGTGTCGCCTTAGTTGTCCCTGCGC

GTCAGGTTATAGAACAGTGGGCTCAAGATGCGGGTATTAGTTACCAAGAT

TTTGCTGAGTTGTGTGATAAAAAGGAAACTGTCTCTGAGGTTCAGCAATC

CCTTACCAAGGTAGCAAAAGATGCAAAACTAGACAAGTTTGAAACGCCTG

CAAAGATAAAGCTGATGCCAGATCCATGGACTCCTGAATCTGGATTAGTA

ACAGCGGCTCTTAAGTTAAAAAGGGAACAACTGAAGTCCAAATTTAAGGA

TGATCTGGATAAGCTATATGGGTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 88%, at least 90%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 5, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 88% to 95%, 89% to 99%, 91 to 98%, or 88% to 100% homology or identity to SEQ ID NO: 5. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 6)

ATGTCGGTTTACACCGTTAAAGTCGAGGATTCACGGGCAGCTTCCGGAGA

AACCCCGTCAGCAGGGCCGGTTTACAGGTGCATTTATGCCAAGGATGCTC

TCATGGAACTGCCCCCCGGTTATGAATCTCCCTGGGACTTCTTTAGTGAG

TCTGTTAAAAGAAACCCAAAGAACCCAGCACTAGGTCGTCGTCAAGTCAT

CGATGGAAAGGCTGGTGGTTATTCATGGCTTTCATATCAAGAAGCCTACA

ATTCTGCTCTACGCATTGCTTCTGCCATCAGAAGCCGATCTGTTAATCCT

GGGGATCGGTGTGGTATATATGGACCTAACTGTCCTGAATGGATAATCTC

AATGGAGGCTTGTAACAGCAATGGCATAACCTATGTTCCCCTATATGATA

CACTTGGTGCTAATGCGGTTGAATACATCATCAACCATGCAGAAATTTCT

TTAGTTTTTGTTCAAGAGAACAAGTTGTCTGCTATTTTATCATGTCTTCC

AAATTGCTCATCAAATCTTAAAACAATCGTCAGCTTTGGGAAGTTCTCTG

AATCACAAAAGAACGAAGCCATGGAACATGGCGTCGATTGCTTCTCTTGG

GAAGAGTTTTCTTCGATGGGGAATTTGGAAGATGAACTTCCTGCAAAAAA

TAAGACTGACATTTGCACCATAATGTATACAAGTGGAACAACGGGAGAGC

CTAAGGGTGTCGTACTAAGTAACAGAGCTTTCATGTCCGAAGTCTTGTCT

ATGCATGAACTACTCATAGAAACAGACAAACCGGGCACAGAAGAAGATAC

CTACTTCTCTTTTCTTCCTTTGGCACATATATTTGATCAAATAATGGAGA

CGTATTTCATCTACAGTGGTGCTTCGATAGGGTTTTGGCAAGGAGATATC

AGATACTTGATTGAAGACCTTCTTGTGTTGCAGCCAACCATATTTTGTGG

TGTTCCAAGAGTTTATGACCGCATTTATACGGGCATAATGGCTAAGATTT

CAACTGGAGGTGCTATTCGGAAGGCATTATTTGATTTTGCATACAACTAT

AAATTAAGGAACCTTGAAAAGGGAATACAACAAGACAAATCAGCTCCTCT

TTTGGACAAGCTGGTCTTCGATAAGATTAAACAAGGGTTTGGAGGAAGGG

TTCGTCTTATGTTATCTGGAGCCGCACCTTTGCCAAAACACGTGGAGGAA

TTTTTAAGAGTGACGTGCTGTACCGTTCTCTCACAAGGATACGGACTTAC

TGAAAGTTGTGGTGGATGCTTTACATCCATTGCGAATGTGTACTCTATGA

TCGGGACTGTTGGTGTACCCATGACAACTATTGAAGCAAGACTTGAGTCA

GTGCCAGAGATGGGATATGATGCACTCAGTAGTGTGCCATGTGGCGAAAT

TTGCCTCAGGGGAAACACACTATTTTCTGGGTACCACAAACGAGACGATC

TAACTGATGCTGTCCTTGTAGATGGCTGGTTCCATACAGGTGACATTGGG

GAATGGCAGGCAGATGGAGCAATGAAAATCATTGACAGGAAAAAGAATAT

ATTCAAATTGTCTCAAGGAGAATATGTTGCAGTTGAAAGTATTGAAAGCA

CCTATTCACGGTGTCCTTTGGTTACCTCGATTTGGGTGTACGGCAATAGT

TTTGAATCTTTTCTAGTTGCGGTTGTGGTTCCCGATAGAGTAGCAGTTGA

AGAGTTTGCTGCAAAGAACAATGAATCAGGAGATTATGCATCGTTGTGCA

AGAACCCAAATGTCAGGAAATATGTTCTTGAAGAGCTGAATGCTGAAGCT

CAATGCAATAAACTTCGCGGGTTTGAGATGCTAAAAGCAGTTCATTTGGA

TCCAGTCCCATTTGACTTCGAGAGGGATTTAATAACACCAACCTTTAAAC

TAAAAAGACAGCAGCTTCTAAAATACTATAAGGATTGCGTTGAACAACTA

TATGCTGAAGCAAAGACATCCAAGAAATGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 89%, at least 90%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 6, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 89% to 95%, 90% to 99%, 91 to 98%, or 89% to 100% homology or identity to SEQ ID NO: 6. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 7)

ATGGAAACTCATGGACCAAGGCTTCTAGGTGCAGCTTACAAAGATCCTAT

CACGAGTTATAAACAGTTCCAAAAGTTCTCTGTTCAACATCTAGAGGTGT

ATTGGTCTCTTGTGTTAGAAAAGCTTTCAATCCAATTTCAGGAACGTCCA

AAATGTATAGTAGATACTTCTGACAAATCAAAACACGGGGGCACATGGCT

TCCCGGTTCAGTTTTGAACATTGCGGAGTGTTGTATATTGTCAACTACTG

AAACAGATGAAAAGGTTGCGATTGTGTGGCGGGATGAAAGATGTGATAAT

CTGGATGTAAACAAGATGACATTCAAAGAATTGCGACAACAAGTAATGTT

GGTTGCAAATGCATTGAAGTTATTGTTTTCAAAAGGAGATCCTATTGCAA

TTGATATGCCAATGACAGTTACTGCAGTAATTCTATATTTGGCGATTGTA

TATTCTGGATTTGTGGTTGTATCTATAGCTGACAGTTTTGCAGCTAAAGA

GATTGCAACACGATTACGTGTATCTAATGCAAAGGCTATCTTTACTCAAG

ATTACATTGTTCGAGGTGGTCGAAGATTTCCTTTGTACAGTCGAGTTATT

GAAGCCACCCAATGTAGAGCCATCGTGGTTCCTGCGATAGGGGAAAACGT

AGAAGTTATTTTAAGAAAACAGGACATTTCATGGGGCGATTTTCTTTCTG

GTGCAAAACAGCTTCCTAGCCCGGATTATTGCTCTCCAGTCTATCAATCC

ATAGACACGTTGACAAACATACTCTTCTCTTCGGGAACAACAGGAGACCC

AAAAGCTATACCATGGACGCAAATATCTCCAATGAGATGTGCTGCTGACG

GATGGGCTCATATGGATATTCAGGCTGGAGATGTTTATTGTTGGCCCACA

AATCTGGGATGGGTCATGGGACCCATTGTACTTTACTCGAGTTTTCTTAC

CGGTGCAACATTGGCTCTTTATAATGGCTCCCCTCTTGGTCATGGTTTTG

GAAAATTTGTTCAGGATGCAGGAGTGACAATTTTGGGCACGGTTCCAAGC

ATAGTCAAGTCTTGGAAGAGTACAAGATGTATGGAAGGACTGGACTGGAC

AAAGATAAAGGCATTTGGGTCGACTGGTGAAGCTTCTAATGTCGACGATG

ACCTTTGGCTTTCCTCAAAGGCCTACTACAAACCTGTTCTTGAATGCTGT

GGAGGTACCGAGCTTGCATCTTCTTATGTTCAAGGGAATCTTCTACAGCC

ACAAGCCTTTGGAGCATTAAGCTCTGCTTCAATGGGAACCGGATTTGTCA

TATTTGACGATCATGGAGTTCCTTACCCGGACGATGAACCCTGTGTTGGT

GAAGTGGGTTTGTTTCCAGTATATATGGGAGCATCTGATAGACTACTGAA

TGCAGATCATGAAAAAATTTACTTCAAGGGAATGCCGAGTTACAAAGGAA

TGCAACTAAGGAGACATGGAGATATCATCAAGAGAACAATTGGAGGATAT

TTGGTTGTACAAGGCAGGGCTGATGATACCATGAACCTTGGTGGCATAAA

GACGAGCTCAATAGAAATTGAGCGTGTTTGTGAACAAGCTGATGGAAGCA

TCATGGAAACTGCTGCAGTCAGTGTTGCACCTGCAACCGGTGGTCCAGAA

CTATTAGCCATATTTGTGGTACTAAAGAACGGTTGCAACACTCAACCACA

GGACCTAAAGATGATATTTTCAAAGGCCATTCAAAAAAACCTCAACCCAT

TGTTCAAGGTGAGCTTTGTAAAGGTTGTTCCAGAGTTCCCTCGAACCGCT

TCTAACAAGTTATTGAGAAGAGTTTTAAGGAATCAAGTGAAGGAAGAGCT

TCAAACTCGAAGTAAAATATAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 85%, at least 87%, at least 90%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 7, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 85% to 94%, 88% to 97%, 85% to 100%, or 92% to 99% homology or identity to SEQ ID NO: 7. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 8)

ATGGAGATCACTAAAAGCATCCAAGAATTAGGATTACAAGATCTACTAAA

CACTGGATTAACACCTAATGATGCAAAATCACTGCAAATCGAGATTAAAC

ACATCATTAATAGTCAAACTACTAATTCAAACCCAGTTGAGTTATGGCGT

CAAATCACTTCTGCAAAGCTGCTTAAACCCTCTTATCCTCATTCGTTGCA

CCAGCTCATCTACTACGCGGTGTACTGTAACTATGATGCATCCATCTATG

GTCCTCCCCTGTATTGGTTTCCATCTGAAATTGATTCTAAAAGGTCAAAC

TTGGGGAACATTATGGAAACTCATGGACCAAGGCTTCTAGGTGCAGCTTA

CAAAGATCCTATCACGAGTTATAAACAGTTCCAAAAGTTCTCTGTTCAAC

ATCTAGAGGTGTATTGGTCTCTTGTGTTAGAAAAGCTTTCAATCCAATTT

CAGGAACGTCCAAAATGTATAGTAGATACTTCTGACAAATCAAAACACGG

GGGCACATGGCTTCCCGGTTCAGTTTTGAACATTGCGGAGTGTTGTATAT

TGTCAACTAGTGAAACAGATGATAAGGTTGCGATTGTATGGCGGGATGAA

AGATGTGATAATCTGGATGTAAACAAGATGACATTCAAAGAATTGCGACA

ACAAGTAATGTTGGTTGCAAATGCATTGAAGTTATTGTTTTCAAAAGGAG

ATCCTATTGCAATTGATATGCCAATGACAGTTACTGCAGTAATTCTATAT

TTGGCGATTGTATATTCTGGATTTGTGGTTGTATCTATAGCTGACAGTTT

TGCAGCTAAAGAGATTGCAACACGATTACGTGTATCTAATGCAAAGGCTA

TCTTTACTCAAGATTACATTGTTCGAGGTGGTCGAAGATTTCCTTTGTAC

AGTCGAGTTATTGAAGCCACCCAATGTAGAGCCATCGTGGTTCCTGCGAT

AGGGGAAAACGTAGAAGTTATTTTAAGAAAACAGGACATTTCATGGGGCG

ATTTTCTTTCTGGTGCAAAACAGCTTCCTAGCCCGGATTATTGCTCTCCA

GTCTATCAATCCATAGACACGTTGACAAACATACTCTTCTCTTCGGGAAC

AACAGGAGACCCAAAAGCTATACCATGGACGCAAATATCTCCAATGAGAT

GTGCTGCTGACGGATGGGCTCATATGGATATTCAGGCTGGAGATGTTTAT

TGTTGGCCCACAAATCTGGGATGGGTCATGGGACCCATTGTACTTTACTC

GAGTTTTCTTACCGGTGCAACATTGGCTCTTTATAATGGCTCCCCTCTTG

GTCATGGTTTTGGAAAATTTGTTCAGGATGCAGGAGTGACAATTTTGGGC

ACGGTTCCAAGCATAGTCAAGTCTTGGAAGAGTACAAGATGTATGGAAGG

ACTGGACTGGACAAAGATAAAGGCATTTGGGTCGACTGGTGAAGCTTCTA

ATGTCGACGATGACCTTTGGCTTTCCTCAAAGGCCTACTACAAACCTGTT

CTTGAATGCTGTGGAGGTACCGAGCTTGCATCTTCTTATGTTCAAGGGAA

TCTTCTACAGCCACAAGCCTTTGGAGCATTAAGCTCTGCTTCAATGGGAA

CCGGATTTGTCATATTTGACGATCATGGAGTTCCTTACCCGGACGATGAA

CCCTGTGTTGGTGAAGTGGGTTTGTTTCCAGTATATATGGGAGCATCTGA

TAGACTACTGAATGCAGATCATGAAAAAATTTACTTCAAGGGAATGCCGA

GTTACAAAGGAATGCAACTAAGGAGACATGGAGATATCATCAAGAGAACA

ATTGGAGGATATTTGGTTGTACAAGGCAGGGCTGATGATACCATGAACCT

TGGTGGCATAAAGACGAGCTCAATAGAAATTGAGCGTGTTTGTGAACAAG

CTGATGGAAGCATCATGGAAACTGCTGCAGTCAGTGTTGCACCTGCAACC

GGTGGTCCAGAACTATTAGCCATATTTGTGGTACTAAAGAACGGTTGCAA

CACTCAACCACAGGACCTAAAGATGATATTTTCAAAGGCCATTCAAAAAA

ACCTCAACCCATTGTTCAAGGTTTTCTCCTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 84%, at least 87%, at least 90%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 8, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 84% to 94%, 88% to 97%, 84% to 100%, or 92% to 99% homology or identity to SEQ ID NO: 8. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 9)

ATGGTGTACAAGTCTTTGAATTCAATATCCATATCAGATATAGTAAATCT

TGGTATATCACCTGAAACTGCAACTCAACTTCATCAGAAACTAACTGAAA

TCATTCAGATTTATGGTTTTGATGCTCCTCAAACATGGACCCAGATATCC

ACCCGGATTCTTCATCCGGACCTTCCCTTTTGTTTTCATCAGATGATGTA

TTATGGATGCTATGTTGATTTTGGACCGGATCCTCCTGCTTGGTCACCCG

ACCCGAAGGATGCAAAGTTAACAAACATAGGTAGTTTATTAGAGAGACGC

GGAAAGGAGTTCTTGGGGCCTAGTTATAAAGATCCCATTTCAAGCTACTC

TGCTCTTCAGGAATTTTCAGCCTTAAATCTAGAGGTGTTTTGGAAAACAA

TATTGGATGAAATGAATATAACATTTTCTGTGCCTCCAAAACGCATATTA

GTTGATGACCTGTCTAAAGAAAGCCAGTTATTGCATCCAGGTGGTCGATG

GCTTCCCGGAGCTTATGTAAATCCAGCTAGAAATTGTTTGAGTTTAAGTA

GCAAGAGAAGGTTAAGTGATATAGCAGTTATATGGCGTGATGAAGGAAAT

GATGATATGCCGGTCAACAAAATGACGTTTCAGCAGTTGCGCTCAGAGGT

TTGGTTAGTTGCATATGCACTTGATACATTGGGAGTGGAAAAAGGATCTG

CAATTGCAATCGATATGCCTATGGATGTCAAATCTGTGGTGATTTATCTA

GCCATTGTTTTAGCAGGCTATGTGGTTGTATCTATTGCAGATAGTTTTGC

TGCTGGTGAAATTTCGACCAGACTTGTATTATCAAAAGCAAAAGCAATTT

TTACTCAGGATTTGATCATTCGTGGTGACAGAAGCCATCCCTTGTACAGC

CGAGTTGTTGATGCTCAATCACCTCTAGCAATTGTCATTCCTACGAGAGG

CTCAAGTTTTAGTATAAAATTACGTGACGGTGATATTTCTTGGCATGATT

TTCTGGAACGAGCTAACACTTACAGGAATGTTGAGTTTGTTGCTGTTGAA

CGACCCGTTGAAGCTTTCTCAAATATCCTTTTCTCATCAGGAACTACAGG

GGAACCGAAGGCAATTCCATGGACCCTTGCAACACCTTTCAAGGCTGGTG

CAGACGCTTGGTGCCACATGGATGTCCACAAAGGTGATGTTGTTGCATGG

CCTACTAATCTTGGATGGATGATGGGTCCTTGGCTAATATATGCTTCATT

GTTAAATGGGGGCTCACTTGCATTATACAACGGATCTCCCCTGACTTCTG

GATTTGCCAAGTTTGTTCAGGATGCAAAAGTAACATTGTTGGGAGTGATA

CCAAGTATTGTGAGGGCATGGAGAACAAACAATAGTACAGCCGGCTTTGA

CTGGTCAACCATCCGGTGCTTTGGATCGACCGGTGAGGCCTCTAATACTG

ATGAATGTCTTTGGCTGATGGGAAGAGCTCATTACAAACCGGTCATCGAG

TATTGCGGTGGCACAGAGATTGGTGGTGGTTTTATTACAGGATCTTTACT

GCAGCCTCAGTGTTTGTCTGCTTTCAGCACACCAAGTTTGGGTTGTAAAC

TGTTAATTCTTGGCGAAGATGGAATCCCTATACCACAAAACGCTCCTGGA

ATTGGTGAATTGGCTCTGAATCCCCTCATGTTTGGGGCATCGAGCACACT

ACTAAATGCAAACCACTATGATGTCTACTTTAAAGGCATGCCCTCTTGGA

ATGGTAAGGTTCTAAGAAGGCATGGAGATGTATTTGAGCGCACGTCTAAA

GGATACTATCGTGCCCATGGTCGTGCAGATGATACTATGAATCTTGGGGG

TATTAAGGTAAGTTCGGTTGAGATTGAACGTGTATGCAACTCGATTGATG

ACAGAATTCTCGAGACAGCGGCTATAGGGGTTACACCTTCTGGTGGCGGG

CCAGAGAGGTTGGTAATTGTTGTTGCTTTTAAAGATGGCAGTGGTTCGAA

ACCCGACTTAATCAAGTTGAAGGTCACACTGAATTCAGCTTTACAAAAGA

ATCTGAACCCTTTGTTTAAGGTTTCTGATGTGGTGCCCTTTCCATCACTT

CCTAGGACAGCAACAAACAAGGTAATGAGAAGGGTTTTGCGACAGCAGTT

GACTCAAATTGGTCAAAATAGCAAGCTATAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 88%, at least 90%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 9, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 88% to 95%, 89% to 99%, 91 to 98%, or 88% to 100% homology or identity to SEQ ID NO: 9. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 10)

ATGACGTTTCAGCAGTTGCGCTCAGAGGTTTGGTTAGTTGCATAT

GCACTTGATACATTGGGAGTGGAAAAAGGATCTGCAATTGCAATC

GATATGCCTATGGATGTCAAATCTGTGGTGATTTATCTAGCCATT

GTTTTAGCAGGCTATGTGGTTGTATCTATTGCAGATAGTTTTGCT

GCTGGTGAAATTTCGACCAGACTTGTATTATCAAAAGCAAAAGCA

ATTTTTACTCAGGATTTGATCATTCGTGGTGACAGAAGCCATCCC

TTGTACAGCCGAGTTGTTGATGCTCAATCACCTCTAGCAATTGTC

ATTCCTACGAGAGGCTCAAGTTTTAGTATAAAATTACGTGACGGT

GATATTTCTTGGCATGATTTTCTGGAACGAGCTAACACTTACAGG

AATGTTGAGTTTGTTGCTGTTGAACGACCCGTTGAAGCTTTCTCA

AATATCCTTTTCTCATCAGGAACTACAGGGGAACCGAAGGCAATT

CCATGGACCCTTGCAACACCTTTCAAGGCTGGTGCAGACGCTTGG

TGCCACATGGATGTCCACAAAGGTGATGTTGTTGCATGGCCTACT

AATCTTGGATGGATGATGGGTCCTTGGCTAATATATGCTTCATTG

TTAAATGGGGGCTCACTTGCATTATACAACGGATCTCCCCTGACT

TCTGGATTTGCCAAGTTTGTTCAGGATGCAAAAGTAACATTGTTG

GGAGTGATACCAAGTATTGTGAGGGCATGGAGAACAAACAATAGT

ACAGCCGGCTTTGACTGGTCAACCATCCGGTGCTTTGGATCGACC

GGTGAGGCCTCTAATACTGATGAATGTCTTTGGCTGATGGGAAGA

GCTCATTACAAACCGGTCATCGAGTATTGCGGTGGCACAGAGATT

GGTGGTGGTTTTATTACAGGATCTTTACTGCAGCCTCAGTGTTTG

TCTGCTTTCAGCACACCAAGTTTGGGTTGTAAACTGTTAATTCTT

GGCGAAGATGGAATCCCTATACCACAAAACGCTCCTGGAATTGGT

GAATTGGCTCTGAATCCCCTCATGTTTGGGGCATCGAGCACACTA

CTAAATGCAAACCACTATGATGTCTACTTTAAAGGCATGCCCTCT

TGGAATGGTAAGGTTCTAAGAAGGCATGGAGATGTATTTGAGCGC

ACGTCTAAAGGATACTATCGTGCCCATGGTCGTGCAGATGATACT

ATGAATCTTGGGGGTATTAAGGTAAGTTCGGTTGAGATTGAACGT

GTATGCAACTCGATTGATGACAGAATTCTCGAGACAGCGGCTATA

GGGGTTACACCTTCTGGTGGCGGGCCAGAGAGGTTGGTAATTGTT

GTTGCTTTTAAAGATGGCAGTGGTTCGAAACCCGACTTAATCAAG

TTGAAGGTCACACTGAATTCAGCTTTACAAAAGAATCTGAACCCT

TTGTTTAAGGTTTCTGATGTGGTGCCCTTTCCATCACTTCCTAGG

ACAGCAACAAACAAGGTAATGAGAAGGGTTTTGCGACAGCAGTTG

ACTCAAATTGGTCAAAATAGCAAGCTATAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 89%, at least 92%, at least 95%, or at least 97% homology or identity to SEQ ID NO: 10, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 89% to 95%, 90% to 97%, 95% to 99%, or 90% to 100% homology or identity to SEQ ID NO: 10. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 11)

ATGAATATAACATTTTCTGTGCCTCCAAAACGCATATTAGTTGAT

GACCTGTCTAAAGAAAGCCAGTTATTGCATCCAGGTGGTCGATGG

CTTCCCGGAGCTTATGTAAATCCAGCTAGAAATTGTTTGAGTTTA

AGTAGCAAGAGAAGGTTAAGTGATATAGCAGTTATATGGCGTGAT

GAAGGAAATGATGATATGCCGGTCAACAAAATGACGTTTCAGCAG

TTGCGCTCAGAGGTTTGGTTAGTTGCATATGCACTTGATACATTG

GGAGTGGAAAAAGGATCTGCAATTGCAATCGATATGCCTATGGAT

GTCAAATCTGTGGTGATTTATCTAGCCATTGTTTTAGCAGGCTAT

GTGGTTGTATCTATTGCAGATAGTTTTGCTGCTGGTGAAATTTCG

ACCAGACTTGTATTATCAAAAGCAAAAGCAATTTTTACTCAGGAT

TTGATCATTCGTGGTGACAGAAGCCATCCCTTGTACAGCCGAGTT

GTTGATGCTCAATCACCTCTAGCAATTGTCATTCCTACGAGAGGC

TCAAGTTTTAGTATAAAATTACGTGACGGTGATATTTCTTGGCAT

GATTTTCTGGAACGAGCTAACACTTACAGGAATGTTGAGTTTGTT

GCTGTTGAACGACCCGTTGAAGCTTTCTCAAATATCCTTTTCTCA

TCAGGAACTACAGGGGAACCGAAGGCAATTCCATGGACCCTTGCA

ACACCTTTCAAGGCTGGTGCAGACGCTTGGTGCCACATGGATGTC

CACAAAGGTGATGTTGTTGCATGGCCTACTAATCTTGGATGGATG

ATGGGTCCTTGGCTAATATATGCTTCATTGTTAAATGGGGGCTCA

CTTGCATTATACAACGGATCTCCCCTGACTTCTGGATTTGCCAAG

TTTGTTCAGGATGCAAAAGTAACATTGTTGGGAGTGATACCAAGT

ATTGTGAGGGCATGGAGAACAAACAATAGTACAGCCGGCTTTGAC

TGGTCAACCATCCGGTGCTTTGGATCGACCGGTGAGGCCTCTAAT

ACTGATGAATGTCTTTGGCTGATGGGAAGAGCTCATTACAAACCG

GTCATCGAGTATTGCGGTGGCACAGAGATTGGTGGTGGTTTTATT

ACAGGATCTTTACTGCAGCCTCAGTGTTTGTCTGCTTTCAGCACA

CCAAGTTTGGGTTGTAAACTGTTAATTCTTGGCGAAGATGGAATC

CCTATACCACAAAACGCTCCTGGAATTGGTGAATTGGCTCTGAAT

CCCCTCATGTTTGGGGCATCGAGCACACTACTAAATGCAAACCAC

TATGATGTCTACTTTAAAGGCATGCCCTCTTGGAATGGTAAGGTT

CTAAGAAGGCATGGAGATGTATTTGAGCGCACGTCTAAAGGATAC

TATCGTGCCCATGGTCGTGCAGATGATACTATGAATCTTGGGGGT

ATTAAGGTAAGTTCGGTTGAGATTGAACGTGTATGCAACTCGATT

GATGACAGAATTCTCGAGACAGCGGCTATAGGGGTTACACCTTCT

GGTGGCGGGCCAGAGAGGTTGGTAATTGTTGTTGCTTTTAAAGAT

GGCAGTGGTTCGAAACCCGACTTAATCAAGTTGAAGGTCACACTG

AATTCAGCTTTACAAAAGAATCTGAACCCTTTGTTTAAGGTTTCT

GATGTGGTGCCCTTTCCATCACTTCCTAGGACAGCAACAAACAAG

GTAATGAGAAGGGTTTTGCGACAGCAGTTGACTCAAATTGGTCAA

AATAGCAAGCTATAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 89%, at least 92%, at least 95%, or at least 97% homology or identity to SEQ ID NO: 11, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 89% to 95%, 90% to 97%, 95% to 99%, or 90% to 100% homology or identity to SEQ ID NO: 11. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 23)

ATGGCATCCTCAATTAATATCTCCAAGATCAGAGAGGCTCAACGA

GCACAAGGTCCAGCCTCTATTCTTGCTGTCGGTACCGCGAATCCG

TCTAATTGCGTGTATCAAGCTGATTATCCTGATTACTACTTTCGA

ATCACTAAAAGTGAACACATGGTTGATCTCAAACGGAAATTCAAG

CGCATGTGTGACCAATCTATGATAAGAAAGCGGTACATGCAAATT

ACGGAGGAGTATCTGAAAGAAAACCCCAACATTTGTGAATACATG

GCTCCATCACTTGACGCCCGTCAAGACGTTGTAGTCGTCGAAGTC

CCAAAACTCGGTAAAGAAGCCGCAACAAAAGCCATCAAAGAATGG

GGCCAACCAAAATCCAAAATTACCCATCTCATCTTTTGTACCACG

TCCGGTGTCGACATGCCCGGAGCAGATTACCAGCTCACCAAACTC

CTCGGTCTTTGTCCTTCAGTCAAACGCTTTATGATGTACCAACAA

GGTTGTTTTGCTGGTGGCACGGTTCTTCGTCTAGCTAAGGACATC

GCTGAGAACAATAAAGGTGCTCGTGTACTTGTCGTTTGTTCCGAG

ATTACAGCTGTCATTTTTCGTGGACCCAACGACACTCACCTTGAT

TCACTTATCGGTCAAGCGTTATTTGGGGATGGGGCATCTTCGGTT

ATCGTGGGGTCTGACCCAGACTTGACAACCGAGCGGCCATTGTTT

GAAATCATATCGGCTGCACAAACGATTTTACCGGACTCTGAAGGT

GCGATAGATGGACACTTGAGGGAAGCTGGGTTAACTTTTCATCTA

CTTAAAGACGTACCGAGGTTGATTTCGAAGAATATAGAGAAAGCT

TTAACACAAGCATTTTCTCCCCTGGGAATTAGTGACTGGAACTCT

ATCTTTTGGGTCACGCACCCTGGTGGTCCAGCTATACTGGACCAA

GTGGAACTCAAACTTGGACTCAAAGAGGAGAAGATGAGAACCACT

AGACATGTTCTCAGTGAATATGGGAACATGTCTAGTGCATGTGTT

TTTTTTGTACTTGATGAAATGAGAAAGAGATCGGCTAAAGGCGGT

GCGAGGACCACCGGAGAAGGGTTAGATTGGGGTGTTCTGTTTGGG

TTTGGTCCGGGTTTAACGGTTGAGACTGTGGTCCTTCATAGTCTC

CCAACTACTATGTCGATTGCGACTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 83%, at least 85%, at least 87%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 23, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 83% to 100%, 88% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 23. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 24)

ATGGCATCCTCAATTAATATCTCCAAGATCAGAGAGGCTCAACGA

GCACAAGGTCCAGCCTCTATTCTTGCTGTCGGTACTGCGAATCCG

TCTAATTGTGTGTATCAAGCTGATTATCCTGATTACTACTTTCGA

ATCACTAAAAGTGAACACATGGTTGATTTGAAAGAGAAATTCCAG

CGCATGTGTGACAAATCTATGATAAGAAAGCGGCACATTCACATT

ACGGAGGAGTTTTTGAAAGAAAACCCAAACCTTTGTGAATACATG

GCTCCATCACTTGACACCCGTCAAGACGTTGTAGTCGTCGAAGTC

CCAAAACTCGGTAAAGAAGCCGCAACAAAAGCCATCAAAGAATGG

GGCCAACCAAAATCCAAAATTACCCATCTCATCTTTTGTACCACG

TCCGGTGTCGACATGCCCGGAGCAGATTACCAGCTCACCAAACTC

CTCGGTCTCCATCCTTCAGTCAAACGCTTTATGATGTACCAACAA

GGTTGTTTTGCTGGTGGCACGGTTCTTCGTCTAGCTAAGGACCTC

GCTGAGAACAATAAAGGTGCTCGTGTACTTGCCGTTTGTTCCGAG

ATTACAGCTGTCACGTTTCGTGGACCCAACGACACTCACATTGAT

TCACTTGTCGGTCAAGCATTATTTGGGGACGGGGCAGCTGCGGTT

ATCGTGGGGTCTGATCCTGACTTGACAACTGAGCGGCCGTTGTTT

GAAATCATATCGGCTGCACAAACGATTTTACCGAACTCTGAAGGT

GCGATAGATGGACATGTGAGGGAAGTTGGGGTAACTATTCATATA

CTTAAAGACGTCCCGGTGTTGATTTCGAAGAATATAGAGAAAGCT

TTAACACAAGCATTTTCTCCCTTAGGAATTAGTGACTGGAACTCG

ATCTTTTGGGTCGTACACCCTGGTGGTCCAGCTATACTGGACCAA

GTGGAACTCAAACTTGGACTCAAAGAGGAGAAAATGAGAACCACT

AGACATGTTCTCAGTGAATATGGGAACATGTCTAGTGCATGTGTT

TTTTTTGTACTTGATGAAATGAGAAAGAGATCGGCTAAAGGCGGT

GCGAGGACCACCGGAGAAGGGTTAGATTGGGGTGTTCTGTTTGGG

TTTGGTCCAGGTTTAACGGTTGAGACGGTGGTCCTTCATAGTCTC

CCAACTACTATGTCGATTGCAACTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 83%, at least 85%, at least 87%, at least 89%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 24, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 83% to 100%, 87% to 100%, 90% to 100%, or 93% to 100% homology or identity to SEQ ID NO: 24. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 25)

ATGGCATCCTCAATTAATATCTCCAAGATCAGAGAGGCTCAACGA

GCACAAGGTCCAGCCTCTATTCTTGCTGTCGGTACCGCGAATCCG

TCTAATTGCGTGTATCAAGCTGATTATCCTAATTACTACTTTCGA

ATCACTAAAAGTGAACACATGGTTGATCTCAAACGGAAATTCAAG

CGCATGTGTGACCAATCTATGATAAGAAAGCGGTACATGCAAATT

ACGGAGGAGTATCTGAAAGAAAACCCCAACATTTGTGAATACATG

GCTCCATCACTTGACGCCCGTCAAGACGTTGTAGTCGTCGAAGTC

CCAAAACTCGGTAAAGAAGCCGCAACAAAAGCCATCAAAGAATGG

GGCCAACCAAAATCCAAAATTACCCATCTCATCTTTTGTACCACG

TCCGGTGTCGACATGCCCGGAGCAGATTACCAGCTCACCAAACTC

CTCGGTCTCTGTCCTTCAGTCAAACGCTTTATGATGTACCAACAA

GGTTGTTTTGCTGGTGGCACGGTTCTTCGTCTAGCTAAGGACATC

GCTGAGAACAATAAAGGTGCTCGTGTACTTGTCGTTTGTTCCGAG

ATTACAGCTGTCATTTTTCGTGGACCCAACGACACTCACCTTGAT

TCACTTATCGGTCAAGCGTTATTTGGGGATGGGGCATCTTCGGTT

ATCGTGGGGTCTGACCCAGACTTGACAACCGAGCGGCCATTGTTT

GAAATCATATCGGCTGCACAAACGATTTTACCGGACTCTGAAGGT

GCGATAGATGGACACTTGAGGGAAGCTGGGTTAACTTTTCATCTA

CTTAAAGACGTACCGGGGTTGATTTCGAAGAATATAGAGAAAGCT

TTAACACAAGCATTTTCTCCCTTGGGAATTAGTGACTGGAACTCT

ATCTTTTGGGTCACGCACCCTGGTGGTCCAGCTATACTGGACCAA

GTGGAACTCAAACTTGGACTCAAAGAGGAGAAGATGAGAGCCTCT

AGACATGTTCTCAGTGAATACGGGAACATGTCTAGTGCATGTGTT

TTTTTTATACTTGATGAAATGAGAAAGAAATCGGATGAAGATGGT

GCGCCGACCACTGGAGAAGGGTTAGATTGGGGTGTTCTGTTTGGG

TTTGGTCCGGGTTTAACGGTTGAGACGGTGGTCCTTCATAGTCTC

CCAACTACTATGTCGATTGCGACTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 83%, at least 87%, at least 89%, at least 90%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 25, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 83% to 100%, 88% to 100%, 93% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 25. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 26)

ATGGCATCCTCAATTAATATCTCTAAGATCAGAGAGGCTCAACGA

GCACAAGGTCCAGCCTCTATTCTTGCTGTCGGTACTGCGAATCCA

TCTAATTATGAGATTCAAGCTGATTTTCCTGATTACTACTTTCGA

GTCACTAAAAGTGAACACATGGCTGATATGAAAGGGACATTCCAG

CGCATGTGTGACAAATCTATGATAAGAAAGCGGCACATGCTCATT

ACGGAGGAGTTTTTGAAAGAAAACCCAAACCTTTGTGAATACATG

GCTCCATCACTTGACACCCGTCAAGACGTTGTAGTCGTCGAAGTC

CCAAAACTCGGTAAAGAAGCCGCAACAAAAGCCATCAAAGAATGG

GGCCAACCAAAATCCAAAATTACCCATCTCATCTTTTGTACTACA

ACTGGTGTCGACATGCCTGGAGCCGATTACCAGCTCACCAAGCTC

CTCGGCCTCGCTCCTTCAGTCAAACGCTTTATGATATACCAACAA

GGTTGTTTTGCTGGTGGCACGGTTCTTCGTCTTGCTAAAGACATA

GCTGAGAACAATAAAGGTGCTCGTGTACTTGCCGTATGTTCAGAG

ATTACAGCTATGTCGTTTCGTGGGCCCAATGACACTCACGTTGAT

TCACTTGTCGGTCAAGCATTATTTGGGGACGGGGCAGCTGCAGTT

ATCGTGGGGTCTGATCCTGACTTGACAACCGAGCGGCCGTTGTTT

GAAATCATATCGGCTGCACAAACGATTTTACCAAACTCTGAAGGT

GCGATAGATGGACATGTGAGGGAAGTTGGTTTAACTATTCATATA

CTTAAAGACGTCCCGGTGTTGATATCGAAGAATATAGAGAAAGCT

TTGACACAAGCATTTTCTCCCTTAGGAATTAGTGACTGGAACTCG

ATCTTTTGGATCGTACACCCTGGTGGTCCAGCTATACTGGACCAA

GTGGAACTCAAAGTTGGACTCAAAAAGGAGAAAATGGCAACCAGT

AGACATGTTCTAAGTGAATACGGGAACATGTCTAGTGCATGTGTT

TTTTTTATAATGGATGAAATGAGAAAGAGATCGGCTAAAGGCGGT

GCGAGGACCACCGGAGAAGGGTTAGATTGGGGTGTTTTGTTTGGG

TTTGGTCCAGGTTTAACGGTTGAGACGGTGGTCCTTCATAGTCTC

CCAACTACAATGTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 82%, at least 85%, at least 89%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 26, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 82% to 100%, 86% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 26. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 31)

ATGGCGGAGTTCACACATTTAGTGGTGGTTAAGTTCAAAGAAGAG

GTGGTTGTGGAGGATATTATGAAAGGGTTGGAGAAACTTGTATCT

CAACTTGATAGTGTCAAGTCCTTTGTTTGGGGAAAGGATATTGAA

AGCATGGAGATGTTAAGGCAAGGATTCACCCATGCAATCATGATG

ACATTTGGTTCTAAAGAAGATTTTACTGCATTTCAATCCCACCCA

AACCATGTTGAATTCTCGGCTACGTTTTCAGCAGCAATCGAAAAG

ATCGTTCTTCTTGATTTCCCAGTTGTTGCTGTCAAGACTGCAACT

GCTTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 72%, at least 75%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 31, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 72% to 95%, 72% to 100%, 75% to 99%, or 80% to 100% homology or identity to SEQ ID NO: 31. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 32)

ATGTCGTCCTTACAAAACAAATTTATCGAACACATTGCTCTTATC

AAAATCAAACCCGGTGTTGAGTCTACCACCTTGATAGATAAACTC

AACGGCCTTTCTTCGATTGAGGTGTTACTGCACTTCAGCGCGGGT

GAACTCCTGGGATCATCCCACGGCTTCACTCACATCGTTCACTGC

CGTGTCAGATCAAAGGATGATCTCCAAATCTACCTTACACATCCT

ATCCACTTGCATCTGGCTGATGATACTTTACCCTTACTTGATGAC

GTCACCGTCGTTGACTGGTTTTCATCCAACTCTGATATTGTGGAT

CCTCCTAAACCAGGATCTGCAATGAGAGTTACGCTGCTGAAGTTG

AAACACGATTCGACTGAAAGTAATAAGTTAGTAGTGATTGAAGGA

ATTAAAAATCAGTTTAAAGGAATTGAAGACGTGATAGTTACAACT

ACTTTTGGTGAGAATTTGTTTCATGAAATGCATGAGAATTTCTCG

ATTGAAATTGACAAAGGATACTCGATTGGTTCGATTGCCTTTGTT

CCTGGATCTGCAGATTTCCAGGTTTTAAATTCAAAGGTAGATAAT

AATAAACTCAATGATTTAACAGAAAGTGAAGTGGTGGTTGATTAT

GTGTTTCCATCAGCCAATTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 32, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 50% to 95%, 55% to 98%, 60% to 99%, or 50% to 100% homology or identity to SEQ ID NO: 32. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 33)

ATGTCCTCTGAAGAGCAGATCGTGGAACACGTGGTCCTGTTCAAA

GTGAAACCTGATGCTGATCCTAGTAAAGTCGCGGCTTGGGTCAAT

GGGCTCAACGGTTTGACCTCACTCCAGCTCGCCCTCCACCTCTCC

GCTGGACAACTCATCCGGTGTCGGTCGTCGTCGCTCACCTTCACT

CACATGCTTCACAGTCGTTACAGATCAAAGGAGCATCTCCGGCAG

TACACCGTTCATCCCGAGCACGTGCGCGTGGTTACAGAGGGTAAA

TCCATCATTGATGACGTCATGGCCCTTGATTGGATGATATCTAAC

GGCGCTGCTAGTAGCGTCTGTCCTAAGCCTGGATCAGCGGTGAGA

GTTGGGTTTTATAAGTTAATGGAGAGTTTGGGGGAAATTGAGAAA

GCTAGGGTTTTGGAAGTGATGGGAGGGATTGAAGAGTTAAGTGTT

GGTGAGAGTTTTTGTGATGACAGGGCCAAGGGTTATACGATTGCT

TCAACCGCCGTGTTTCCCAATGGCAATCCTGCTGCTGATTTGGAT

TTATATCATTCCGGTGACCAGCTCCTGCTGAAAGAGGAAGTGATG

AAGGATTCTATACAAAGTGTGGTGGTTGTTGATTACGTAATTCCA

TCTCCCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 67%, at least 72%, at least 78%, at least 85%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 33, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 67% to 95%, 70% to 98%, 75% to 99%, or 67% to 100% homology or identity to SEQ ID NO: 33. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 34)

ATGGGAGAAGTGAAGCACATACTTTTAGCGAAGTTTAAGGATGGA

ATCTCGGAACAACAGATCCAGCATCTCATCACAGGTTATGCTAAC

CTCGTCAATCTCGTTGAACCCATGAAGTCTTTTCGATGGGGAAAA

GATGTGAGCATTGAGAATCTGCACCAAGGCTTTACTCATGTGTTC

GAGTCAACCTTTGAAACCACTGAAGGCATTGCAACTTATATATCT

CATCCTGCTCATGTCGAGTTCGCCACTGGTTTCCTGGATCAACTG

GAAAAAGTCATAGTCATCGACTACAAACCTACATCAGTTGACCCG

TGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 74%, at least 78%, at least 85%, at least 89%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 34, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 74% to 95%, 78% to 98%, 80% to 99%, or 75% to 100% homology or identity to SEQ ID NO: 34. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 35)

ATGCTATGTGCTCCAGCACGCACACGATTACTTCCATCAATTTCT

CTCTTACCTTCCCAACATAACATCTTCCGCCGCCTGAACTGTCTC

ATCCACCGTCGCAACCACCACCAAACGCCGATCACGATGTCTGCT

CAACAACAAATCGTGGAACACGTAGTGCTCTTCAAAGTAAAACCG

GATGTTGATTCTAGTAAAGTTGCTGCAATGGTCAACGGACTCAAC

GGATTGACCTCACTCGATCTTACTCTCCACCTCTCCGCCGGACAG

CTCCTCCGGTCACGGTCATCATCGCTGACCTTCACTCACATGCTT

CACAGTCGTTACAGATCAAAGGACGATCTCCGGGAGTACGCTGCT

CATCCTGACCACGTGCGAGTCGTGACGGAGAATATAAAACCGGTT

ATTGATGATATCATGGCTGTTGATTGGATATCTAACGATGCCAGT

GTATCGCCTAAGCCAGGGTCGGCGATGAGAGTAACATTTTTGAAA

TTAAAGGAGAATTTGGGGGAAAATGAGAAATCTAGGGTTTTGGAA

GTGATTGGAGGAATCAAAAATCAGTTTAAATCAATTGAGGAGTTA

AGTGTTGGTGAGAATTTTTCTCATGATAGAGCCAAGGGGTATACG

ATTGCTTCAATTGCTGTGTTACCCGGGCCTTCCGAGCTGGAGGCA

TTGGATTCGAATACTGAGCTGGTGAAGTTGGAAAAGGAGAAAGTG

AAGGACTTACTGGAGAGCGTTGTGGTTGTTGATTATGTGATTCCA

TCTCTGCAATCGGCTAGTCTTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 69%, at least 75%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 35, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 69% to 95%, 70% to 100%, 80% to 99%, or 68% to 100% homology or identity to SEQ ID NO: 35. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 36)

ATGGCAGTTGCTCAACTTTCTTCCTCCCTCTGTATCTCCACACCC

GCTAGAATCTCTACTGGTTCTGGGTTTTCGTCATCAGGTTTGCCT

CGGATTGGGACAACGTTTGTATGCGGTTCAGGTTCGCCTCTTGTG

ATATCTGGAACATATCATCAGAAGGCTCGAGTACATAAGCCTGCA

GCATTATCTGTGAGATGTGAACAAAGTAGTAAGGATGGAAATGGT

TTAAATGTGTGGCTTGGTCGAACAGCAATGGTTGGCTTTGCAGTG

GCAATTAGTGTTGAAGTATCAACTGGGAAGGGGCTTCTTGAGAAC

TTTGGGCTCACATCACCCTTGCCAACAGTGGCCTTGGCACTGACT

GCACTTGGGGGCGTTCTTACAGCACTTTTCATCTTCCAGTCTGCT

TCTGAGAGTTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 73%, at least 75%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 36, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 73% to 95%, 73% to 100%, 80% to 99%, or 80% to 100% homology or identity to SEQ ID NO: 36. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 37)

ATGATTGAACACATAGTCCTCCTCAAATTTAAATCCGACGTCGAC

TCTACCAAAGTCGAGTCCATGATTAACGAACTCAACGGATTGGCT

TCACTCGATGTTGCACTCGACGTGAGTGCCGGTAAAATCCTGCGA

GTGAGTAGTACATCATCCTCTTCTCTCACTTTCACCCACCTCTTT

CGCTGTTGTTTCAGATCAGCCGATGATCAGCAAGTCTTCTCTACT

CATCCTGACCATCTACGAGTGGCCATTGAAGTTCGACCCGTAATT

GAAGATATGGTAGTTGTTGACTTGGTATCCAAAACTACAATTGAC

TCACCAAACCCAGGATCTGCAATGAAAGTTAGGATATTTAAGTTG

AAAGACGATCTGATCGAAGATAGTAAGTTAGTAGTGATGGAAGGA

ATTAAAAATGAGTTAAAAGCAGTTGAACATATTAGGTTTGGTGAC

AACATTAATGTTATGGCAAAGGGATACTCGATTGCTATGATTGCT

TTTTTTCCTGATTTGGAATCTTCGGTTGCAGGTGCAGAAATTGTT

AAGGATTATATAGAGAGCGAGCTGGTGGTGGATTTTGTGTTTCCA

CCACCAAACGTTACAAGTCATTCATGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 69%, at least 78%, at least 85%, at least 89%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 37, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 69% to 95%, 70% to 98%, 71% to 99%, or 69% to 100% homology or identity to SEQ ID NO: 37. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 38)

ATGGCGGAGTTCACACATTTAGTGGTGGTTAAGTTCAAAGAAGAG

GTGGTTGTAGAGGATATTATGAAAGGGTTGGAGAAACTTGCATCT

CAACTTGATAGTGTCAAGTCCTTTGTTTGGGGAAAGGATATTGAA

AGCATGGAGATGTTAAGGCAAGGATTCACCCATGCAATCATGATG

ACATTTGGTTCTAAAGAAGATTTTACTGCATTTCAATCCCACCCA

AACCATGTTGAATTCTCGGCTACGTTTTCAGCAGCAATCGAAAAG

ATCGTTCTTCTTGATTTCCCAGTTGTTGCAGTCAAGACTGCAACT

GCTTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 88%, at least 90%, at least 92%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% homology or identity to SEQ ID NO: 38, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 88% to 95%, 88% to 98%, 89% to 99%, or 88% to 100% homology or identity to SEQ ID NO: 38. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 47)

ATGGAGTTATCACTCTCATCATCTTCTTCTTCATCCCTTCCCCAA

CTTCATACTCATCCTTCATCATCATCATCTTCTTCACATTACATA

AAAAAATCACCTTTTTTTATTAATAAATTCAATAATCACACCAAA

TGCAAATTCCACAATTCCTCTGCTCTGAGAACTAATTTCTTCTAC

ACTACCATAACTAAAACCTCATCATCAAGATTCGTTCTAAACAAA

AACCCAAACCAATTTTCCGTCAAGGCTTGCAGTCAAGTTGGTTCT

GCTGGATCCGATCCAGCATTGAATAAAGTTGCAGACTTTAAAGAT

GCATTTTGGAGGTTTCTAAGGCCCCATACTATTCGTGGGACAGCA

TTAGGATCAGTGTCTTTAGTAACGAGAGCACTACTTGAAAACCCA

AACTTGATTCGGTGGTCACTTTTGCTCAAGGCATTTTCAGGTCTT

GTTGCTTTGATATGTGGGAATGGTTATATAGTCGGGATCAATCAG

ATCTATGATATCGGTATTGATAAGGTGAACAAACCATATTTACCT

ATTGCTGCGGGAGATCTTTCTGTCCAGTCAGCATGGTTTTTGGTG

TTAGCATTTGCAATGGTAGGCGTTATTATTGTTGGGATGAACTTC

GGCCCATTCATCACCTCCCTTTATTCTCTCGGTCTTTTCTTGGGC

ACCATCTATTCCGTTCCACCACTTCGAATGAAGAGATTTCCTGTT

GTTGCATTTCTTATCATCGCCACGGTGAGAGGTTTTCTTCTAAAT

TTTGGTGTGTATTATGCGGTTAGAGCAGCTCTGGGACTAACATTC

CAATGGAGCTCAGCAGTGGCTTTTATCACAACCTTCGTTACATTA

TTTGCTTTAGTCATTGCCATTACTAAAGATCTTCCTGATGTAGAG

GGTGACCGAAAGTTTCAAATTTCTACTTTTGCAACAAAACTTGGA

GTAAGAAACATTGCATTATTAGGGTCAGGACTTCTGCTGATCAAT

TATATTGGGTCTATCGTTGCAGCACTTTACATGCCTCAGGCTTTC

AGGAGCAGCTTGATGATACCATTACATACCATATTAGCTTCCTGT

TTGATTTACCAGGCATGGATACTTGAGCGTGCGAATTACACCCAG

GAGGCGATAGCTGGGTACTACCGATTTGTATGGAATCTGTTTTAT

TCAGAGTACATCATATTTCCTTTCATCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 75%, at least 79%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 47, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 75% to 100%, 80% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 47. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 48)

ATGGCTACTATGGCTTCTTCTTTGCTGAATCCTCTTTCTTGTTCCATTA

AACCCAACTCAAACAGACTACCATTACCAACACCCATTTCTCTATCTCG

TTCTTGTAGAAGGCTAACAATCAAAGCAACGGAGACAGATGCAAATGAA

GTGAAGCCAAAGGCGCCAGAGAAAGCACCAGCTGCAAGTGGATCTGGTT

TTAATCAAATTCTTGGGATTAAAGGGGCTAAACAAGAAACTAATAAATG

GAAGATCCGTGTTCAACTTACAAAGCCGGTTACTTGGCCTCCATTAATT

TGGGGAGTCGTATGTGGAGCTGCTGCTTCTGGTAACTTCCAATGGACTG

TGGAAGATGTTGCTAAATCAATTGTTTGCATGTTGATGTCTGGCCCATT

TCTAACCGGTTACACACAGACGATCAATGATTGGTATGATAGAGACATT

GATGCTATTAATGAACCTTACCGTCCAATTCCTTCCGGAGCCATATCTG

AAAATGAGGTCATTACTCAAATTTGGGTACTTCTTTTAGGAGGCATCGG

ATTGGCTGGTATATTAGACGTGTGGGCAGGGCATAAGTCCCCTACAATA

TTCTATCTTGCTTTGGGTGGATCATTGTTATCTTATATCTACTCAGCTC

CACCTTTAAAGCTCAAACAGAATGGATGGATTGGCAACTTTGCATTAGG

AGCAAGCTATATTAGCTTACCATGGTGGGCTGGTCAAGCATTGTTCGGA

ACTCTTACACCTGATATAGTAGTTCTCACACTTTTGTACAGCATAGCTG

GGCTTGGTATTGCTATAGTAAATGACTTTAAAAGTGTTGAAGGAGACAG

GAAAATGGGGCTTCAGTCCCTTCCCGTGGCTTTTGGTGAAGAGACAGCT

AAATGGATATGTGTTGGTGCCATTGACATAACTCAACTCTCTATTGCAG

GTTACCTTTTAGGATCTGGTAAACCATATTACGCCTTAGCACTCGTTGG

GTTGATTGTTCCACAAATCTTTTTTCAGTTCAAGTACTTTCTTAAAGAT

CCAGTTAAATATGATGTCAAGTATCAGGCTAGTGCTCAACCATTTCTCA

TTCTTGGTCTTCTGGTGACTGCCTTAGCTACTAGTCACTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 80%, at least 85%, at least 90%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 48, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 80% to 100%, 85% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 48. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 49)

ATGAAGTCTTTGATTATTGGGTCTTTTTCTAATAAGGTTTCTTGTTATT

CCCCATCATTACCAGATTCATCTTCTTCACTTATACCAACAGGTTGTTA

TCATGTATCACTAAGAACATTTCAGCGTAACCGAGCCATTCAAGCTCAA

TCAAGTCTTGTGAGATGCAATATTGGCAAATTCAATGAAACATTACTAC

TTTCGCGGAAACGAAGTACAAAACATGTTGCATGTGCGGTTTCTGAACA

ACCCATTGAACCAGATGCTACAAACCCTCAAAGTTCATTACCAAATGCT

TTGGATGCTTTCTATAGGTTTTCAAGACCTCATACAGTTATAGGAACTG

CATTGAGCATAGTTTCGGTTTCACTCCTAGCGGTTCAAAAGCTTTCGGA

TTTTTCTCCACTATTCTTCATTGGCGTTTTCGAGGCTATTGTTGCTGCC

TTCTTTATGAACATATACATTGTTGGCTTGAACCAGCTATCCGATATTG

AAATAGACAAGGTTAACAAGCCGTACCTTCCATTGGCATCTGGAGAATA

TTCAGTTCAAACTGGTATTATCATTGTATCATCATTTGCAGTCATGAGT

TTCTGGCTTGGATGGATCGTGGGCTCATGGCCTTTATTTTGGGCACTTT

TCATAAGTTTTCTTCTAGGGACCGCATATTCAATCAATATACCGATGTT

GAGATGGAAGCGCTTTGCTCTTGTGGCAGCAATGTGTATTCTAGCTGTA

AGAGCTATTATAGTTCAAGTTGCATTTTATTTGCACATTCAGACTTTTG

TGTATGGAAGACTCGCCGTGTTCCCAAAACCCGTGATATTTGCAACCGG

ATTTATGAGTTTCTTCTCTGTTGTTATAGCATTGTTCAAGGACATACCC

GACATTGTTGGAGACAAGATTTTTGGCATTCAATCATTTACTGTCCGTA

TGGGTCAAAAACGGGTGTTTTGGATTTGCATCTTATTACTTGAAATAGC

TTATGGTGTTGCTATTCTAGTTGGGGCATCATCTCCCTTCCTTTGGAGC

CGATACATAACGGTATTGGGTCATGCGATTCTTGGTCTGATTCTCTGGG

GTCGTGCCAAGTCAACGGATCTGGAGAGCAAATCAGCAATAACCTCATT

TTACATGTTCATATGGCAGTTGTTCTATGCCGAGTATTTGCTCATACCG

CTCGTGAGATGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 75%, at least 79%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 49, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 75% to 100%, 80% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 49. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 50)

ATGGAGTTATCACTCTCATCATCTTCTTCTTCATCCCTTCCCCAACTTC

ATACTCATCCTTCATCATCATCATCTTCTTCACATTACATAAAAAAATC

ACCTTTTTTTATTAATAAATTCAATAATCACACCAAATGCAAATTCCAC

AATTCCTCTGCTCTGAGAACTAATTTCTTCTACACTACCATAACTAAAA

CCTCATCATCAAGATTCGTTCTAAACAAAAACCCAAACCAATTTTCCGT

CAAGGCTTGCAGTCAAGTTGGTTCTGCTGGATCCGATCCAGCATTGAAT

AAAGTTGCAGACTTTAAAGATGCATTTTGGAGGTTTCTAAGGCCCCATA

CTATTCGTGGGACAGCATTAGGATCAGTGTCTTTAGTAACGAGAGCACT

ACTTGAAAACCCAAACTTGATTCGGTGGTCACTTTTGCTCAAGGCATTT

TCAGGTCTTGTTGCTTTGATATGTGGGAATGGTTATATAGTCGGGATCA

ATCAGATCTATGATATCGGTATTGATAAGGTGAACAAACCATATTTACC

TATTGCTGCGGGAGATCTTTCTGTCCAGTCAGCATGGTTTTTGGTGTTA

GCATTTGCAATGGTAGGCGTTATTATTGTTGGGATGAACTTCGGCCCAT

TCATCACCTCCCTTTATTCTCTCGGTCTTTTCTTGGGCACCATCTATTC

CGTTCCACCACTTCGAATGAAGAGATTTCCTGTTGTTGCATTTCTTATC

ATCGCCACGGTGAGAGGTTTTCTTCTAAATTTTGGTGTGTATTATGCGG

TTAGAGCAGCTCTGGGACTAACATTCCAATGGAGCTCAGCAGTGGCTTT

TATCACAACCTTCGTTACATTATTTGCTTTAGTCATTGCCATTACTAAA

GATCTTCCTGATGTAGAGGGTGACCGAAAGTTTCAAATTTCTACTTTTG

CAACAAAACTTGGAGTAAGAAACATTGCATTATTAGGGTCAGGACTTCT

GCTGATCAATTATATTGGGTCTATCGTTGCAGCACTTTACATGCCTCAG

GCTTTCAGGAGCAGCTTGATGATACCATTACATACCATATTAGCTTCCT

GTTTGATTTACCAGGCATGGATACTTGAGCGTGCGAATTACACCCAGCG

ATCACAGTACTTTGACATGTCATCTTGCAGGAGGCGATAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 91%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 50, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 91% to 100%, 93% to 100%, 95% to 100%, or 97% to 100% homology or identity to SEQ ID NO: 50. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 51)

ATGGAGTTATCACTCTCATCATCTTCTTCTTCATCCCTTCCCCAACTTC

ATACTCATCCTTCATCATCATCATCTTCTTCACATTACATAAAAAAATC

ACCTTTTTTTATTAATAAATTCAATAATCACACCAAATGCAAATTCCAC

AATTCCTCTGCTCTGAGAACTAATTTCTTCTACACTACCATAACTAAAA

CCTCATCATCAAGATTCGTTCTAAACAAAAACCCAAACCAATTTTCCGT

CAAGGCTTGCAGTCAAGTTGGTTCTGCTGGATCCGATCCAGCATTGAAT

AAAGTTGCAGACTTTAAAGATGCATTTTGGAGGTTTCTAAGGCCCCATA

CTATTCGTGGGACAGCATTAGGATCAGTGTCTTTAGTAACGAGAGCACT

ACTTGAAAACCCAAACTTGATTCGGTGGTCACTTTTGCTCAAGGCATTT

TCAGGTCTTGTTGCTTTGATATGTGGGAATGGTTATATAGTCGGGATCA

ATCAGATCTATGATATCGGTATTGATAAGGTGAACAAACCATATTTACC

TATTGCTGCGGGAGATCTTTCTGTCCAGTCAGCATGGTTTTTGGTGTTA

GCATTTGCAATGGTAGGCGTTATTATTGTTGGGATGAACTTCGGCCCAT

TCATCACCTCCCTTTATTCTCTCGGTCTTTTCTTGGGCACCATCTATTC

CGTTCCACCACTTCGAATGAAGAGATTTCCTGTTGTTGCATTTCTTATC

ATCGCCACGGTGAGAGGTTTTCTTCTAAATTTTGGTGTGTATTATGCGG

TTAGAGCAGCTCTGGGACTAACATTCCAATGGAGCTCAGCAGTGGCTTT

TATCACAACCTTCGTTACATTATTTGCTTTAGTCATTGCCATTACTAAA

GATCTTCCTGATGTAGAGGGTGACCGAAAGTTTCAAATTTCTACTTTTG

CAACAAAACTTGGAGTAAGAAACATTGCATTATTAGGGTCAGGACTTCT

GCTGATCAATTATATTGGGTCTATCGTTGCAGCACTTTACATGCCTCAG

GTGAAAACCACTTCGATAGACCATTACAGACCATACAGCTTCCTGGTTG

ATTTACCAGGTCAAAATGGGATTACTTTAGCAGCTTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 91%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 51, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 91% to 100%, 93% to 100%, 95% to 100%, or 97% to 100% homology or identity to SEQ ID NO: 51. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 52)

ATGGCTACTATGGCTTCTTCTTTGCTGAATCCTCTTTCTTGTTCCATTA

AACCCAACTCAAACAGACTACCATTACCATTACCAATACCCATTTCTCT

ATCTCGTTCTTGTAGAAGGCTAACAATCAAAGCAACGGAGACAGATGCA

AATGAAGTGAAGCCAAAGGCGCCAGAGAAAGCACCAGCTGCAAGTGGAT

CTGGTTTTAATCAAATTCTTGGGATTAAAGGGGCTAAACAAGAAACTAA

TAAATGGAAGATCCGTGTTCAACTTACAAAGCCGGTTACTTGGCCTCCA

TTAATTTGGGGAGTCGTATGTGGAGCTGCTGCTTCTGGTAACTTCCAAT

GGACTGTGGAAGATGTTGCTAAATCAATTGTTTGCATGTTGATGTCTGG

CCCATTTCTAACCGGTTACACACAGACGATCAATGATTGGTATGATAGA

GACATTGATGCTATTAATGAACCTTACCGTCCAATTCCTTCCGGAGCCA

TATCTGAAAATGAGGTCATTACTCAAATTTGGGTACTTCTTTTAGGAGG

CATCGGATTGGCTGGTATATTAGACGTGTGGGCAGGGCATAAGTCCCCT

ACAATATTCTATCTTGCTTTGGGTGGATCATTGTTATCTTATATCTACT

CAGCTCCACCTTTAAAGCTCAAACAGAATGGATGGATTGGCAACTTTGC

ATTAGGAGCAAGCTATATTAGCTTACCATGGTGGGCTGGTCAAGCATTG

TTCGGAACTCTTACACCTGATATAGTAGTTCTCACACTTTTGTACAGCA

TAGCTGGGCTTGGTATTGCTATAGTAAATGACTTTAAAAGTGTTGAAGG

AGACAGGAAAATGGGGCTTCAGTCCCTTCCCGTGGCTTTTGGTGAAGAG

ACAGCTAAATGGATATGTGTTGGTGCCATTGACATAACTCAACTCTCTA

TTGCAGGTTACCTTTTAGGATCTGGTAAACCATATTACGCCTTAGCACT

CGTTGGGTTGATTGTTCCACAAATCTTTTTTCAGTTCAAGTACTTTCTT

AAAGATCCAGTTAAATATGATGTCAAGTATCAGGCTAGTGCTCAACCAT

TTCTCATTCTTGGTCTTCTGGTGACTGCCTTAGCTACTAGTCACTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 90%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 52, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the polynucleotide comprises a nucleic acid sequence with 90% to 100%, 92% to 100%, 95% to 100%, or 97% to 100% homology or identity to SEQ ID NO: 52. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 53)

ATGGCATCTCTAGCTATTGGTTCACTTGGTAGCCCAAGCTCACGTCAGT

GTTCTAGCCCCGTTGCATCATCTTCTTCATTTGCGATAGGGTCACAAAT

AGCTTCAAAGTTTCTTCGGATATCAAAATTTGATAAGACTAAGAACAGC

CCCTTAACATTGCAACAAAAGCATATAAACAAAAGCATAGATCAAAGCT

TCTTTGAGCCGCTTCCATTGCACAAAATAAACAAAGACAAGTTTAAGTT

GTATGCAACATCTACAAACAATCCTCAGTTTGATGCAACTCATGATTTG

AAGACTCCGGAAGTATCCATTATCAACTTTGTGGACGCTCTTTATAGGT

TAATAAGGCCGTATACAGCAGTTGTAACGATCGTAAGTGTAGTCGCGAT

GTCCCTTCTTACAGTTAATAGCCTTTCAGATTTTTCCCCATTGTTCTTC

ATCAAAGTGGTACAGGCTCTTATTGGAGGCATATTCATGCAAATGTATG

TTAGTGGTTTCAATCAAATTTGTGATATAGAACTCGACAAGGTTAACAA

ACAGTCTCTTCCATTAGCGGCTGGAGAACTATCTATGAAAACTGCGATC

GTCATCGCATCACTATCAGCTATCATGAGCTTATCGATTGGTTGGTTTG

TTGGCTCCCCACCATTATTGTGGTGTCTTGTTTGGTGGTTTATTGTTGG

GACTGCATATTCGGCCAACGTGCTGCCTTATTTGCGATGGAAAAGGTTT

CCTTTCACAGCAGCATTTTGCGCCATGACGTCTCGGGCACTAGTTCTTC

CTATTGGATATTACTTGCATATGCAGAATTCCATCCCGGGAGTATCTGC

ATTACTTTCAAGGCCAATATTATTTGCAGTCGCAATGCTCAGTGCATTT

TCTTTATCAGCGATGTTCTTTAAGGACATCCCTGATATTAAGGGAGATA

GGATGCATGGAATCAAGTCTCTAGCAATTAAACTGGGTGAAAAACGGGT

GTATTGGATTTCCATTTCGATTATTGAAATTGCTTATATTGCTGCTGCA

TTTATTGGAGCAACTTCACCCATAAGCTGGAGCAAGTATGTAACGATTA

TCGGTCATCTTGGAATGGGATTACTACTTTGGGTACGAGCCAGATCAGT

AGATCCGACGAACACGGTAGCCGTTCAATCGATGTATATGTTCCTTATT

AAGCTAGTATATGCAGAATACGGACTTATCTCGCTTGTACGCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 77%, at least 79%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 53, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 77% to 100%, 85% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 53. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 54)

ATGAAGTCTTTGATTATTGGGTCTTTTTCTAATAAGGTTTCTTGTTATT

CCCCATCATTACCAGATTCATCTTCTTCACTTATACCAACAGGTTGTTA

TCATGTATCACTAAGAACATTTCAGCGTAACCGAGCCATTCAAGCTCAA

TCAAGTCTTGTGAGATGCAATATTGGCAAATTCAATGAAACATTACTAC

TTTCGCGGAAACGAAGTACAAAACATGTTGCATGTGCGGTTTCTGAACA

ACCCATTGAACCAGATGCTACAAACCCTCAAAGTTCATTACCAAATGCT

TTGGATGCTTTCTATAGGTTTTCAAGACCTCATACAGTTATAGGAACTG

CATTGAGCATAGTTTCGGTTTCACTCCTAGCGGTTCAAAAGCTTTCGGA

TTTTTCTCCACTATTCTTCATTGGCGTTTTCGAGGCTATTGTTGCTGCC

TTCTTTATGAACATATACATTGTTGGCTTGAACCAGCTATCCGATATTG

AAATAGACAAGGTTAACAAGCCGTACCTTCCATTGGCATCTGGAGAATA

TTCAGTTCAAACTGGTATTATCATTGTATCATCATTTGCAGTCATGAGT

TTCTGGCTTGGATGGATCGTGGGCTCATGGCCTTTATTTTGGGCACTTT

TCATAAGTTTTCTTCTAGGGACCGCATATTCAATCAATATACCGATGTT

GAGATGGAAGCGCTTTGCTCTTGTGGCAGCAATGTGTATTCTAGCTGTA

AGAGCTATTATAGTTCAAGTTGCATTTTATTTGCACATTCAGACTTTTG

TGTATGGAAGACTCGCCGTGTTCCCAAAACCCGTGATATTTGCAACCGG

ATTTATGAGTTTCTTCTCTGTTGTTATAGCATTGTTCAAGGACATACCC

GACATTGTTGGAGACAAGATTTTTGGCATTCAATCATTTACTGTCCGTA

TGGGTCAAAAACGGGTGTTTTGGATTTGCATCTTATTACTTGAAATAGC

TTATGGTGTTGCTATTCTAGTTGGGGCATCATCTCCCTTCCTTTGGAGC

CGATACATAACGGTATTGGGTCATGCGATTCTTGGTCTGATTCTCTGGG

GTCGTGCCAAGTCAACGGATCTGGAGAGCAAATCAGCAATAACCTCATT

TTACATGTTCATATGGCAGTTGTTCTATGCCGAGTATTTGCTCATACCG

CTCGTGAGATGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 89%, at least 90%, at least 92%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% homology or identity to SEQ ID NO: 54, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 89% to 100%, 92% to 100%, 94% to 100%, or 97% to 100% homology or identity to SEQ ID NO: 54. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 55)

ATGTTGATTCACCATGAACATTTTTTGACAACCGGATTTGAAAGTTCAA

ACGATCGAGCTGCTTATTCAATAAACTTTTCGAAACAACATCACTTACA

CATGGCGTCTATAGCTACTGGTTCACTTTGTAGGCCAACCTCACATCAA

TTTTCTATCCCCGTTGCATCATCTTCTTCATTTGCGACAGGATCACAAT

TCGCTTCAAAGTTTCTTCATATATCAATATCTGCTAAAAAAAGCTCATT

GACATTGCAACAAAGGCATATTCATAAAAACATAGATCAAAGCTTCTTA

AAGCCGCTTGCACTTCAAAAATTGAACAAAGACAAGTTTAAGTTGAATG

GAACATCTCCAGACAATCCTCAGTTTGATGCAACTCATGATTTGAAGAC

TCAAATAGAATCCACTATCAACTTTGTGGACGTTCTTTATAGGTTGTTA

AGGCCGTATGCATTACTTCAAATGGGTTTATGTGTAGTCACGATGAGTC

TTCTTACCGTTGAAAGCCTTTCAGATTTTTCCCCATTGTTCTTCGTCAA

AGTGGCACAGGCTCTTATTGGAGGCATATTCATGCAAATGTATGTTAAT

GGTTTTAATCAGATTTGTGATATAGAACTCGACAAGGTTAACAAACCGT

CTCTTCCGTTAGCATCTGGGGAACTATCTAAGACAACTACTATAGTCGT

CTCTTCACTATCAGCTATTACGAGCTTATCGATTGGTTGGTTTGTTGGC

TCCCCACCATTGTTGTGGAGTCTTGTTGTGTGGTTTATTGCTGGGACTA

CATATTCGGCTAATCTGCCATATTTGCGATGGAAAAGGTTTCCTTTCAC

AAATATGTTTTGCAACTTGACGATGGCACTAGTTGTTCCTATTGGAACT

TACTTGCATATGGAGAATTCCATCCACGGAGTATCCACATTACTTTCAA

GGCCACTATTATTTACAGTTGCAATGTGCACTGTGTTTCCTGTTTCGAT

AATACTCTTTAAGGACATCCCTGATATTAAGGGAGACCGGATGCATGGA

ATGAAGTCTCTAGCAATTATACTGGGTGAAAAACGGACGTATTGGATAT

GCATTTGGATTCTTGAAATCACTTATATTGCTGCTGCTTTTTTCGGAGC

AACTTCACCCATCAGCTGGAGCAAATATGTAACGATTATTAGTCATCTA

GGAATGGGGTTCTTACTTTGGCTACGATCCAAATCAGTAGATGTGAAGA

ACACAGTAGCCGTTCAATCTATGTATATGTTCCTTTGGAAGCTACTCTA

TGCAGAATATGGCCTTATCTTGCTTGTACGCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 76%, at least 80%, at least 85%, at least 90%, at least 95%, at least 97%, at least 98%, or at least 99% homology or identity to SEQ ID NO: 55, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 76% to 100%, 83% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 55. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 56)

ATGTTTATTCACCATGAACAGTTTTTGACAACCGGATTTGAAAGTTCAA

ACGATCGAGCTGCCTATTCAATAAACTTTTTGAAACAACATCACTTACA

CATGGTGTCTATAGCTACTGGTTCACTTTGTAGGCCAACCTCACATCGA

TTCTCTATCCCCGTTGCATCATCTTCTTCATTTGCGACAGGATCACAAT

TCGCTTCAATATCTGCTAAAAAAAGCTCATTGACATTGAAACAAAGGCA

TACTCATAAAAACATAGATCAAAGCTTCTTCAAGCCGCTTGCACTTCAA

AAAATGAACAAAGGCAAGTTTAAGTTGAATGCAACATCTCCAGACAATT

CTCAGTTGGATGCAACTCATGATTTGAAGACTCAAATAGAATCCATTAT

CAACTTTGTGGACGTTCTTTATAGGTTGATAAGGCCGTATGTAGTACTT

GGAATGGGTGTAACTATAGTCACGATGTGTCTTCTTACCGTTGATAGCC

TTTCAGATTTTTCCCCATTGTTCTTCGTCAAAGTGGCACAGGCTCTTAT

TGGAAGCATATTCATGGCAATGTATGTTAATAGTTTTAATGAGATTTGT

GATATAGAACTCGACAAGGTTAACAAACCGTCTCTTCCGTTAGCGTCTG

GGGAACTATCTATGACAACTGCTATTGTCGTCTCTTCACTATCAGCTAT

CATGAGCTTATCGATTGGTTGGTTTGTTGGCTCCCCACCATTGTTGTGG

AGTCTTGTTGTGTGGTTTATTCTTGGGACTGCATATTCGGCTAATCTGC

CATATTTGCGATGGAAAAGGTTTCCTTTAACAACACTGTCTTCCGCCCT

GACGATGGGGGCACTAGTTATTCCTATTGGAAATTACATGCATATGGAG

AATTCCATCCGCGGAGTAACCACATTACTTTCAAGGCCACTATTATTTG

CAGTTGCAATGTGCGCTGCGTTTCATGTTTCGACGATACTCTTTAAGGA

CATCCCTGATATTAAGGGAGACCGGATGCATGGAATGAAGTCTCTAGCA

ATTAAACTGGGTGAAAAACGGATGTATTGGATATGCATTTGGATTCTTG

AAATCGCTTATATTGCTGCTGCTTTTTTCGGAGCAACTTCACCCATCAG

CTGGAGCAAATATGTAACGATTATTAGTCATCTAGGAATGGGGTTCTTA

CTTTGGCTACGATCCAAATCAGTAGATGTGAAGAACACAGTAGCCGTTC

AATCTATGTATATGTTCCTTTGGAAGCTATTCTATGTAGAACATGGTCT

TATCTTGCTTGTACGTTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 75%, at least 80%, at least 85%, at least 90%, at least 95%, at least 97%, at least 98%, or at least 99% homology or identity to SEQ ID NO: 56, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 75% to 100%, 80% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 56. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 57)

ATGGCGTCTATAGCTACTGGTTCACTTTGTAGGCCAACCTCACATCGAT

TTTCTATCCACGTTGCATCATCTTCTTCATTTGCGACAGGATCACAGTT

TGCTTCAAAGATTCTTCAGATATCAATATCTGCTAAAAAAAGCTCATTG

ACATTGCAACAAAGGCATATTCATAAAAACATAGATCAAAGCTTCTTCA

AGCCGCTTGCACTTCAAAAAATGAACAAAGACAAGTTTAAGTTGAATGC

AACATCTCCAGACAATCCACAGTTTGATGCAACTCGTGATTTGAAGACT

CAAATAGAATCCATTATCAAGTTTGTGGACGTTCTTTATAGGTTGTTAA

GGCCGTACGCAATACTTGAAATGGGTTTAAGTGTAGTCACGATGAGTCT

TCTTACCGTTGAAAGCCTTTCAGATTTTTCCCCGTTGTTCTTCGTCAAA

GTGGCACAAGCTCTTATTGGAGGCATATTCATGCAAATGTATGTTAATG

GTTTTAATCAGATTTGTGATATAGAACTCGACAAGGTTAACAAACCGTC

TCTTCCGTTAGCGTCTGGGGAACTATCTACGACAACTACTATAGTCGTC

TCTTCACTATCAGCTATTATGAGCTTATCGATTGGTTGGTTTGTTGGCT

CCCCACCATTGTTGTGGAGTCTTGTTGTGTGGTTTATTGTTGGGACAAC

ATATTCGACTAATCTGCCATATTTGCGATGGAAAAGGTTTCCTTTCACA

GCAATGTTTTGCAACCTGACGAGGGCACTAGTTGTTCCTATTGGAACTT

ACTTGCATATGAAGAATTCCATCCACGAAGTATCCACATTACTTTCAAG

GCCACTGTTATTTGCAGTTGCAATGTGCACTGTGTTTCCTATTTCGATA

ATACTCTTTAAGGACATCCCTGATATTAAGGGAGACCGGATGCATGGAA

TGAAGTCTCTAGCAATTATACTGGGTGAAGAACGGACGTATTGGATATG

CATTTGGATTCTTGAAATCGCTTATATTGCTGCTGCTTTTTTCGGAGCA

ACTTCACCCATCAGCTGGAGCAAATATGTAATGATTATTAGTCATCTAG

GAATGGGGTTCTTACTTTGGCTACGATCCAAATCAGTAGATGTGAAGAA

CACAGTAGCCGTTCAATCTATGTATATGTTCCTTTGGAAGCTACTCTAT

GCAGAATATGGCCTTATTTTGCTTGTACGCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 76%, at least 80%, at least 85%, at least 90%, at least 95%, at least 97%, at least 98%, or at least 99% homology or identity to SEQ ID NO: 57, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 76% to 100%, 85% to 100%, 90% to 100%, or 96% to 100% homology or identity to SEQ ID NO: 57. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 58)

ATGGCATCTCTAGCTATTGGTTCACTTGGTAGCCCAAGCTCACGTCAGT

GTTCTAGCCCCGTTGCATCATCTTCTTCATTTGCGATAGGGTCACAAAT

AGCTTCAAAGTTTCTTCGGATATCAAAATTTGATAAGACTAAGAACAGC

CCCTTAGCATTGCAACAAAAGCATATAAACAAAAGCATAGATCAAAGCT

TCTTTGAGCCGCTTCCATTGCACAAAATAAACAAAGACAAGTTTAAGTT

GTATGCAACATCTACAAACAATCCTCAGTTTGATGCAACTCATGATTTG

AAGACTCCGGAAGTATCCATTATCAACTTTGTGGACGCTCTTTATAGGT

TAATAAGGCCGTATACAGCAGTTGTAACGATCGTAAGTGTAGTCGCGAT

GTCCCTTCTTACAGTTAATAGCCTTTCAGATTTTTCCCCATTGTTCTTC

ATCAAAGTGGTACAGGCTCTTATTGGAGGCATATTCATGCAAATGTATG

TTAGTGGTTTCAATCAAATTTGTGATATAGAACTCGACAAGGTTAACAA

ACAGTCTCTTCCATTAGCGGCTGGAGAACTATCTATGAAAACTGCGATC

GTCATCGCATCACTATCAGCTATCATGAGCTTATCGATTGGTTGGTTTG

TTGGCTCCCCACCATTATTGTGGTGTCTTGTTTGGTGGTTTATTGTTGG

GACTGCATATTCGGCCAACGTGCTGCCTTATTTGCGATGGAAAAGGTTT

CCTTTCACAGCAGCATTTTGCGCCATGACGTCTCGGGCACTAGTTCTTC

CTATTGGATATTACTTGCATATGCAGAATTCCATCCCGGGAGTATCTGC

ATTACTTTCAAGGCCAATATTATTTGCAGTCGCAATGCTCAGTGCATTT

TCTTTATCAGCGATGTTCTTTAAGGACATCCCTGATATTAAGGGAGATA

GGATGCATGGAATCAAGTCTCTAGCAATTAAACTGGGTGAAAAACGGGT

GTATTGGATTTCCATTTCGATTATTGAAATTGCTTATATTGCTGCTGCA

TTTATTGGAGCAACTTCACCCATAAGCTGGAGCAAGTATGTAACGATTA

TCGGTCATCTTGGAATGGGATTACTACTTTGGGTACGAGCCAGATCAGT

AGATCCGACGAACACGGTAGCCGTTCAATCGATGTATATGTTCCTTATT

AAGCTAGTATATGCAGAATACGGACTTATCTCGCTTGTACGCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 77%, at least 79%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 58, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 77% to 100%, 85% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 58. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 71)

ATGGGGCTAAACATTTGCACTAGATTTATACCTTGTTTGGTAGTGGTTC

TCATGTTTTTGTTCACTTCAACATATTCAGCTACACCAGAAGACAAATT

CCTTCAATGCATATCTCAAAAATTAAATATCACAAACTCAGATGAAGTG

TTCACTCAATCAAACACACGATATTCATCTGTTCTTGAGTCAACAATAG

TTAACCTTAGATTTGCCACTTCTACAACGCCAAAACCATTTGCTATAAT

CACACCTTTGTCATATTCACATGTACAATCTGCTGTAGTTTGTGCTAAA

AAAGCCGGAATCCGAATTAGAATCAGAAGTGGTGGCCATGACTATGTGG

GCCTTTCATATACTTCATCTGATAATGTCCCTTTTGTTGTTCTTGACCT

TAAACAGCTGCAGAATGTTACGGTCGAGTATAGTAAGAAAACGGCTTGG

GTTGAATCTGGTGCAACCATCGGTCAACTGTATTATTGGGTGTCTCAGA

AAAGTAAAAATCTAGGATTCCCGGGTGGGACCTGCGCAACTATAGGGGT

CGGAGGGCACCTAAGTGGTGGGGGTTTTGGTACTTTGGTAAGAAAGTAT

GGTCTATCGGCTGATAACGTTATTGATGCTAAGATAGTTGATGTCAATG

GTAGACTTCTTGATAGAAAGTCTATGGGGGAAGATTTGTTTTGGGCAAT

TAGAGGAGGCGGTGGAGGAAGTTTCGGTGTTGTAGTAGCTTGGATGGTC

AATCTTGTTCATGTTCCTGAAAAAGTTACAGCTTTTACTATTGTCAGGA

CTTTGGAACAAGGTGGTTCGGATCTTTTCAACAAGTGGCAGCACGTTGG

GCCCAAATTAACCAAAGATTTGTTCATTAGTGTTATAATACAGCCCATT

TCTGTTTGGAATGGAAACGGAACAGTTCAAGTTATATTCAACTCGATGT

ATCTTGGGACGGTTGATAAGCTCATGAAGACCGTCAACAGTAGCTTTCC

GGAGTTGGGGTTACAAGCAAAAGACTGCACTGAGATGAGTTGGATTCAG

TCAGTACTTTATTTTGCGGGTTACCCTATAGAAGGAAGTATGGATGTTC

TTAAAGATAGGAAACCCCAGACCAGAAGATACTTTAATAATAAATCAGA

TCACGTGAAAGAACCGATACCCAAAGAAAGATTAGAAGATTTATGGAAA

TGGTGTATGGAAGGTGATTTTCCGATTCTTCTAATGGACCCACTCGGTG

GAAAGATGAACGAGATTGACACAACAAGAATTCCGTACCCTTATAGAAA

TGGTTATTCGTATATGATACAATACGTTGAGACCTGGGAAAACATTGGG

GACTCAGAAAAGCGTATAAGTTGGATGAGACAGATGTATGAGAATATGA

CACCGTATGTGTCGAAGAATCCAAGGTCAGCTTATGTGAATTATAGGGA

TTTGGATTTAGGTAAAAACGATAACGCTAAAAACACGAGTTACTTGGAA

GCCATGAAATGGGGAAGCAAGTACTTTGGTGACAATTTCAAGAGGTTGG

CTATGGTGAAAGGTGTAGTTGATCCAGACAATTTCTTCTTTCATGAACA

AAGCATCCCACCTCTGAAAGTGTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 68%, at least 75%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 71, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 68% to 95%, 75% to 100%, 72% to 99%, or 68% to 100% homology or identity to SEQ ID NO: 71. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 72)

ATGGGGTGTAATCTCTTGCAAAAACTTACTATTTTTGTTTTCTTTATCA

TGTCTATTTCCATACCTTCTTTCGCTTACGAACACGAGCACGAGCATGA

GCACGAACACGAAAATGATCAAGATCGAGTACAGGATGAAAAGGAACCT

ACGGATGTCTTCACTTCGTGTTTAACTCGGTTCGGTGTTCATAATTTTA

CAACTCATTCCAAGTCGAATAATGATAATTCGGTTTACTATGAGCTTCT

TAATTTTTCAATTCAAAATCTTAGATTTACGGGTTTATCGATGCCTAAA

CCGGTTGTTATCGTGTTCCCGGAGACGAAAGAACAGTTAGCAAAAACCG

TGGTTTGTGCTCGAGAATCGTCGCTAGAAATTCGGGTTCGGTGTGGTGG

TCATAGCTATGAAGGGACATCATCCGTCTCCACGGACGGACGTCCATTT

GTGGTGATTGATATGACGAGATTAGACAATGTTTCGGTGGACGTGAACT

CGGGAACCGCATGGGTTGAAGCTGGCGCGACACTTGGTCAAATGTACTG

CGCGATAGCAGAGTCGAGCACGGTCCATGGTTTCTCGGCAGGGTCATGC

CCCACTGTCGGAACAGGTGGTCATATTTCGGGTGGTGGGTTTGGGTTAT

TGTCGCGAAAATACGGGCTGGCTGCGGATAATGTAGTCGATGCGGTTTT

AGTAACCGCAGATGGTGAATTACTGAACCGCGACACGATGGGTGAGGAT

GTTTTTTGGGCGATTAGAGGTGGTGGTGGCGGGGTTTGGGGAATTGTGT

ACGCTTTTAATGTTAAATTATCAAGCGTACCAAAAACAGTCACTAATTT

CGTCGTGTCTAGGCCAGGCACGAAGGGACAAGTGACTGATTTGGTATAT

AAATGGCAGCATGTTGCGCCTAAATTGCCCGACGACTTCTACTTATCCT

CTTTCGTTGGTGCGGGTTTGCCTGAACGAAAAAATAAACCGGGTTTATC

GGCTACGTTCAAAGGTTTTTATTTGGGATCGAAAAGCAAAGCTTTATCG

ATCATGAACCAAACTTTCCCCGAGCTAAAAGTCATGGAAAACGACTGTA

AAGAAACAAGTTGGATTGAGTCTATTCTTTTCTTCTCGGGTTATGGAGA

TGAAAGCTCGGTTTCTGACTTGAAAAATCGCTTCTTACAAGATAAATTG

TATTACAAGGCCAAATCGGACTATGTTCGGAAACCTATTCCAAGATTCG

GTCTAACTACGGCACTAGAAATACTCGAGAAACAACCAAAAGGGTATGT

GATCTTGGACCCATATGGTGGCGCAATGCAAACGATAAGTAGTGACTCG

ATCCCGTTCCCTCATAGGAAAGGTAATATTTTCACTATTCAATATCTAG

TGGAATGGAAAGAACCGGATAACGATAAAACGAATGATTACTTAGCGTG

GATACGAGACTTTCATGGCTCGATGACGCCCTATGTGGCACAAGACCCA

CGAGCCGCATACATTAACTACATGGATGTTGATATTGGAGTCATGAATT

GGATCAAAACTAGAGTGGACTCAGATGATGCAGTTGAGATGGGTCGAGA

ATGGGGGGAGAAGTACTTTTATAAGAATTACGATCGGCTAGTGAGAGCG

AAGACACAAATCGATCCGTACAATGTTTTTAGGCATCAACAAAGCATCC

CTCCAATGTCTTTGGAGAACAAGAATCGCAGGGGAAGTATATCTAGTGA

GTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 71%, at least 77%, at least 85%, at least 93%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 72, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 71% to 95%, 75% to 98%, 80% to 99%, or 71% to 100% homology or identity to SEQ ID NO: 72. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 73)

ATGAAAACATCATCAAATATGCTTTCCGTATTACTCATTCTATTCTTTA

TCACATGCTCAAAAGCAGCTCTGGATCCTGATTCCGTCTATCAATCATT

TCTCCAATGTTTACCGTTATACTCACCGGAGTCCGCGGAGGAACTCTCC

AAGGTCGTATACAGCTCCACCTTGAACACCACAACATACGAAACCGTAC

CGAACGATTTAACACCACCGCGACACCCAAACCGTCGGTTATCATAACC

CAACCGAATCTCAAGTCCAAGCGGCCGTCCTATGCGCGAAAAAAACCGG

TCTCCAAGAGTACATAAAAAACGAGTCCAAATTAAAATTCGTAGCGGCG

GACACGACTACGAAGGAATATCGTATATTTCATCCGAACCTGATTTTAT

CGTACTTGACATGTTTAACTTTCGGTCGATAAATGTTAATGTAGCGGAC

GAAACCGCGGTTGTGGGCGCCGGCGCGCAGTTGGGCGAGCTTTATTATA

GGATTTACGAAAAAAGTAAAACTCTCGGGTTCCCCGCGGGAGTTTGTCA

GACGGTTGGCGTGGGAGGTCATCTGAGCGGCGGTGGTTACGGAACTATG

CTGCGAAAATACGGGTTGTCAGTTGATCATGTGATTGATGCGAAAATTG

TTGATGTGAATGGTCAGGTTTTGGATCGGAAATCGATGGGTGAGGATCT

ATTTTGGGCGATACGAGGTGGCGGTGGCGGTAGTTTTGGTGTGATTTTG

TCGTATACTGTGAAGTTGGTTTCGGTTCCCGAGGTTAACACGGTCTTTC

GCGTGCTGAAAACGACGTCGGAAAATGCTTCTGAACTGATTTATAAGTG

GCAGTCGATTATGCCGGATATTGATAACGATTTGTTTATCAGAGTTTTG

TTACAACCGGTTACGGTGAATAAACAGAAAGTTGGTCGGGCTACGTTTA

TAGCGCATTTTTTAGGTGATTCTGATAGATTGGTGGCGTTGATGAGTAA

AAACTTCCCGGAATTGGGTTTAAAGAAAGAGGATTGTATCGAGGTGAGT

TGGATAGAATCGGTACTTTATTGGGCTAACTTTGATTTGAATACGACGA

AGCCAGAGATTCTTCTAGATCGACATTCCGACAGTGTGAGCTATGGTAA

ACGAAAGTCGGACTATGTGCAAACCCCGATTCCTGAATCCGGGTTGGAA

TCGATTTTTGAAAAGTTAGTCGAATTGGGTAAAATCGGGTTGGTTTTTA

ACTCGTATGGCGGGAGAATGTCGGAGGTTGCGGCTGACGCAACACCATT

CCCTCACCGAGCTGGGAACATTTTCAAGATTCAGTATTCGGTTAATTGG

AATGATGCGGACCCTGAACTAGAAGCGAATTACTTAAATCAAAGTAGGG

TTATGTACGACTTCATGACACCATTTGTATCGAAGAATCCGAGAGCTGC

ATTCTTGAATTATCGGGATCTCGATATTGGAGTAATGACTCCTGGCAAG

AACAGTTATAGTGAAGGTGAAGTTTATGGTGAGAAATACTTCATGGGAA

ATTTCGAAAGATTGGTGAAGATAAAAACCGCGGTTGATCCCGATAATTT

CTTTAGAAATGAACAAAGTATTCCGACTCGGGCCGCGAAAAATTCAGGC

AAGTCAAGAAAGATGATGAAGTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 69%, at least 75%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 73, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 69% to 95%, 75% to 100%, 72% to 99%, or 69% to 100% homology or identity to SEQ ID NO: 73. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 74)

ATGGGGCTAAACATTTGCACTAGATTTATACCTTGTTTGGTAGTGGTTC

TCATGTTTTTGTTCACTTCAACATATTCAGCTACACCAGAAGACAAATT

CCTTCAATGCATATCTCAAAAATTAAATATCACAAACTCAGATGAAGTG

TTCACTCAATCAAACACACGATATTCATCTGTTCTTGAGTCAACAATAG

TTAACCTTAGATTTGCCACTTCTACAACGCCAAAACCATTTGCTATAAT

CACACCTTTGTCATATTCACATGTACAATCTGCTGTAGTTTGTGCTAAA

AAAGCCGGAATCCGAATTAGAATCAGAAGTGGTGGCCATGACTATGTGG

GCCTTTCATATACTTCATCTGATAATGTCCCTTTTGTTGTTCTTGACCT

TAAACAGCTGCAGAATGTTACGGTCGAGTATAGTAAGAAAACGGCTTGG

GTTGAATCTGGTGCAACCATCGGTCAACTGTATTATTGGGTGTCTCAGA

AAAGTAAAAATCTAGGATTCCCGGGTGGGACCTGCGCAACTATAGGGGT

CGGAGGGCACCTAAGTGGTGGGGGTTTTGGTACTTTGGTAAGAAAGTAT

GGTCTATCGGCTGATAACGTTATTGATGCTAAGATAGTTGATGTCAATG

GTAGACTTCTTGATAGAAAGTCTATGGGGGAAGATTTGTTTTGGGCAAT

TAGAGGAGGCGGTGGAGGAAGTTTCGGTGTTGTAGTAGCTTGGATGGTC

AATCTTGTTCATGTTCCTGAAAAAGTTACAGCTTTTACTATTGTCAGGA

CTTTGGAACAAGGTGGTTCGGATCTTTTCAACAAGTGGCAGCACGTTGG

GCCCAAATTAACCAAAGATTTGTTCATTAGTGTTATAATACAGCCCATT

TCTGTTTGGAATGGAAACGGAACAGTTCAAGTTATATTCAACTCGATGT

ATCTTGGGACGGTTGATAAGCTCATGAAGACCGTCAACAGTAGCTTTCC

GGAGTTGGGGTTACAAGCAAAAGACTGCACTGAGATGAGTTGGATTCAG

TCAGTACTTTATTTTGCGGGTTACCCTATAGAAGGAAGTATGGATGTTC

TTAAAGATAGGAAACCCCAGACCAGAAGATACTTTAATAATAAATCAGA

TCACGTGAAAGAACCGATACCCAAAGAAAGATTAGAAGATTTATGGAAA

TGGTGTATGGAAGGTGATTTTCCGATTCTTCTAATGGACCCACTCGGTG

GAAAGATGAACGAGATTGACACAACAAGAATTCCGTACCCTTATAGAAA

TGGTTATTCGTATATGATACAATACGTTGAGACCTGGGAAAACATTGGG

GACTCAGAAAAGCGTATAAGTTGGATGAGACAGATGTATGAGAATATGA

CACCGTATGTGTCGAAGAATCCAAGGTCAGCTTATGTGAATTATAGGGA

TTTGGATTTAGGTAAAAACGATAACGCTAAAAACACGAGTTACTTGGAA

GCCATGAAATGGGGAAGCAAGTACTTTGGTGACAATTTCAAGAGGTTGG

CTATGGTGAAAGGTGTAGTTGATCCAGACAATTTCTTCTTTCATGAACA

AAGCATCCCACCTCTGAAAGTGTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 79%, at least 85%, at least 92%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 74, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 79% to 98%, 80% to 99%, 82% to 99%, or 79% to 100% homology or identity to SEQ ID NO: 74. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 75)

ATGGACCAATATGTCATAACTAAATTTATATCATATCTTCTGGCGGTTTT

TATGGCTTTATTCTGTTCAGATCCAACGGCTGATAAATTTCTTCAATGCT

TCACTAAAGATTCAAATGCAACAGATTCAAACTTTGTGTTCACCCAAGAA

AACACACAATATTCATCTGTTCTTGAGTCAACTATCATAAACCTTAGATT

TGCAACCTCCATAACTCCAAAACCAATAGCTGTAATCACACCATTATCAT

ATTCCCATGTACAATCAGCAATACTTTGTTCCAAAAAAATCGGATATCGA

ATTAGAATCAGAAGTGGTGGGCATGACTATGCAGGAGTTTCATACACTTC

ATATGATCATGATCATACCCCTTTTGTTGTTCTTGATCTTAAAGAGCTGA

GGACGATAACAATCGATTCGGGTGAGAACACTTCATGGGTTGAATCTGGT

GCAACTGTTGGTGAACTGTATTATTGGGTGTCCCAAAAAAGTCGAAATCT

TGGGTTCCCAGCTGGGATTTGTCCAACTGTTGGGGTAGGTGGTCATTTAA

GTGGAGGTGGGGTTGGTACTATGGTAAGAAAGTATGGTCTAGCGGCTGAT

AATGTAATCGATGCTAGGATTATTGATGTAAATGGGCGAATTCTTGATAG

GAAATCGATGGGGGAAGATTTGTTTTGGGCGATTAGAGGTGGTGGGGGAG

CTAGTTTTGGTGTTATAGTAGCTTGGAAGGTAAATCTTGTTTATGTTCCT

GAAAAAAGTTTCGGTTTTTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 82%, at least 87%, at least 92%, at least 96%, or at least 99% homology or identity to SEQ ID NO: 75, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 82% to 98%, 83% to 99%, 85% to 99%, or 82% to 100% homology or identity to SEQ ID NO: 75. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 76)

ATGGAGTTGTATATTAGCACTAGATTTATACTATGTTTTCTAGTGGTTCT

TATGCTTATGTTCTCTTCAACATATTCAGATCCACTAGAAGATAAATTTC

TTCGATGTCTATCTCAAAATTCAAATGCCACAAATTCAGACAATGTGTTC

ACTCAAGAAAACACACAGTATTCATCTGTTCTTGAGTCAACTATCATAAA

CCTTAGATTTGCAACCTCTACAACTCCGAAACCGTTAGCTATAATCACAC

CGTTGTCATGTTCCCATGTACAATCTGCTGTACTTTGTGCCAAAAAAGTC

GGAATCCGAATTAGAATCAGAAGTGGTGGCCATGACTATGCAGGCCTTTC

ATACACTTCATCTGAGAATGCCCCTTTTGTTGTTCTTGATCTTAAACAGC

TGCAGAATGTTACGGTCGAGTCTAGTAAGAAAACGGCTTGGGTTGAATCT

GGTGCAACCATCGGTCAATTGTATTATTGGGTGTCTCAAAAAAGTAAAAA

TCTAGGATTCCCAGCTGGGACCTGCGCGACTATAGGGGTCGGAGGGCACC

TAAGTGGTGGGGGTTTCGGTACTTTGGTAAGAAAGTATGGTCTATCGGCT

GATAACGTCATCGATGCTAAGATAGTTGATGTCAATGGTAGACTTCTTGA

TAGAAAGTCTATGGGGGAAGATTTGTTTTGGGCAATTAGAGGAGGCGGTG

GAGGAAGTTTCGGTGTTGTAGTAGCTTGGAAGGTCAATCTTGTTCATGTT

CCCGAAAAAGTTACGGCTTTTACTATTGTCAGGACTTTGGAACAAGGTGG

TTCGGATATTTTCAACAAATGGCAGCACATTGGGCACAAATTAACTAAAG

ATTTGTTCATTAGAGTTATAATACAGCCTATTTCTGTTTCGAATGGAAAC

AGAACAGTTCAAGTTATATTCAACTCGATGTATCTGGGGACGGTTGATAA

GCTCATGAAGACCGTCAACAGTAGCTTCCCGGAGTTGGGCTTACAAGAAA

AAGACTGCACTGAGATGAGTTGGATTCAGTCAGTACTTTATTTTGCGGGT

TACCCAATAGAAGGAAGTATGGATGTTCTTAAAGATAGGAAACCCGACAC

CCGAAATTACTTTGATAATAAATCAGATCACGTGAAAGAACCGATACCCA

AAGAAAGATTAGAAGATCTATGGAAATGGTGTATGGAAGTTGATTTTCCG

ATTCTTATAATGGAGCCACTCGGTGGAAAGATGAACGAGATTGACACAAC

AAGAATTCCATACCCTTATAGAAAAGGTTATTCGTATATGATACAATATG

TTGAGGCTTGGGATAACATTGGGGACTCGGAAAAACATATAAGTTGGTTG

AGACAGATGTATGAGAATATGACACCATATGTGTCGAAGAATCCAAGGTC

AGCTTATGTGAATTACCGGGATTTGGATTTAGGTAAAAACGATAACGCTA

AAAACACGAGTTACTTGGAAGCCATGAAATGGGGAAGCAAGTACTTTGGT

GACAATTTCAAGAGGTTGGCTATGGTGAAAGGTGTAGTTGATCCAGACAA

TTTCTTCTTTCATGAACAAAGCATCCCACCTCTGAAAGTGTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 80%, at least 87%, at least 93%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 76, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 80% to 98%, 81% to 99%, 85% to 99%, or 80% to 100% homology or identity to SEQ ID NO: 76. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 77)

ATGGGGCTAAACATTTGCACTAGATTTATACCTTGTTTGGTAGTGGTTCT

CATGTTTTTGTTCACTTCAACATATTCAGCTACACCAGAAGACAAATTCC

TTCAATGCATATCTCAAAAATTAAATATCACAAACTCAGATGAAGTGTTC

ACTCAATCAAACACACGATATTCATCTGTTCTTGAGTCAACAATAGTTAA

CCTTAGATTTGCCACTTCTACAACGCCAAAACCATTTGCTATAATCACAC

CTTTGTCATATTCACATGTACAATCTGCTGTAGTTTGTGCTAAAAAAGCC

GGAATCCGAATTAGAATCAGAAGTGGTGGCCATGACTATGTGGGCCTTTC

ATATACTTCATCTGATAATGTCCCTTTTGTTGTTCTTGACCTTAAACAGC

TGCAGAATGTTACGGTCGAGTATAGTAAGAAAACGGCTTGGGTTGAATCT

GGTGCAACCATCGGTCAACTGTATTATTGGGTGTCTCAGAAAAGTAAAAA

TCTAGGATTCCCGGGTGGGACCTGCGCAACTATAGGGGTCGGAGGGCACC

TAAGTGGTGGGGGTTTTGGTACTTTGGTAAGAAAGTATGGTCTATCGGCT

GATAACGTTATTGATGCTAAGATAGTTGATGTCAATGGTAGACTTCTTGA

TAGAAAGTCTATGGGGGAAGATTTGTTTTGGGCAATTAGAGGAGGCGGTG

GAGGAAGTTTCGGTGTTGTAGTAGCTTGGATGGTCAATCTTGTTCATGTT

CCTGAAAAAGTTACAGCTTTTACTATTGTCAGGACTTTGGAACAAGGTGG

TTCGGATCTTTTCAACAAGTGGCAGCACGTTGGGCCCAAATTAACCAAAG

ATTTGTTCATTAGTGTTATAATACAGCCCATTTCTGTTTGGAATGGAAAC

GGAACAGTTCAAGTTATATTCAACTCGATGTATCTTGGGACGGTTGATAA

GCTCATGAAGACCGTCAACAGTAGCTTTCCGGAGTTGGGGTTACAAGCAA

AAGACTGCACTGAGATGAGTTGGATTCAGTCAGTACTTTATTTTGCGGGT

TACCCTATAGAAGGAAGTATGGATGTTCTTAAAGATAGGAAACCCCAGAC

CAGAAGATACTTTAATAATAAATCAGATCACGTGAAAGAACCGATACCCA

AAGAAAGATTAGAAGATTTATGGAAATGGTGTATGGAAGGTGATTTTCCG

ATTCTTCTAATGGACCCACTCGGTGGAAAGATGAACGAGATTGACACAAC

AAGAATTCCGTACCCTTATAGAAATGGTTATTCGTATATGATACAATACG

TTGAGACCTGGGAAAACATTGGGGACTCAGAAAAGCGTATAAGTTGGATG

AGACAGATGTATGAGAATATGACACCGTATGTGTCGAAGAATCCAAGGTC

AGCTTATGTGAATTATAGGGATTTGGATTTAGGTAAAAACGATAACGCTA

AAAACACGAGTTACTTGGAAGCCATGAAATGGGGAAGCAAGTACTTTGGT

GACAATTTCAAGAGGTTGGCTATGGTGAAAGGTGTAGTTGATCCAGACAA

TTTCTTCTTTCATGAACAAAGCATCCCACCTCTGAAAGTGTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 79, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 77, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 79% to 95%, 82% to 97%, 81% to 98%, or 79% to 100% homology or identity to SEQ ID NO: 77. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 78)

ATGGGGGAAGATTTGTTTTGGGCAATTAGAGGAGGCGGTGGAGGAAGTTT

CGGTGTTGTAGTAGCTTGGATGGTCAATCTTGTTCATGTTCCTGAAAAAG

TTACAGCTTTTACTATTGTCAGGACTTTGGAACAAGGTGGTTCGGATCTT

TTCAACAAGTGGCAGCACGTTGGGCCCAAATTAACCAAAGATTTGTTCAT

TAGTGTTATAATACAGCCCATTTCTGTTTGGAATGGAAACGGAACAGTTC

AAGTTATATTCAACTCGATGTATCTTGGGACGGTTGATAAGCTCATGAAG

ACCGTCAACAGTAGCTTTCCGGAGTTGGGGTTACAAGCAAAAGACTGCAC

TGAGATGAGTTGGATTCAGTCAGTACTTTATTTTGCGGGTTACCCTATAG

AAGGAAGTATGGATGTTCTTAAAGATAGGAAACCCCAGACCAGAAGATAC

TTTAATAATAAATCAGATCACGTGAAAGAACCGATACCCAAAGAAAGATT

AGAAGATTTATGGAAATGGTGTATGGAAGGTGATTTTCCGATTCTTCTAA

TGGACCCACTCGGTGGAAAGATGAACGAGATTGACACAACAAGAATTCCG

TACCCTTATAGAAATGGTTATTCGTATATGATACAATACGTTGAGACCTG

GGAAAACATTGGGGACTCAGAAAAGCGTATAAGTTGGATGAGACAGATGT

ATGAGAATATGACACCGTATGTGTCGAAGAATCCAAGGTCAGCTTATGTG

AATTATAGGGATTTGGATTTAGGTAAAAACGATAACGCTAAAAACACGAG

TTACTTGGAAGCCATGAAATGGGGAAGCAAGTACTTTGGTGACAATTTCA

AGAGGTTGGCTATGGTGAAAGGTGTAGTTGATCCAGACAATTTCTTCTTT

CATGAACAAAGCATCCCACCTCTGAAAGTGTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 80%, at least 85%, at least 89%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 78, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 80% to 95%, 85% to 98%, 89% to 99%, or 80% to 100% homology or identity to SEQ ID NO: 78. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 79)

ATGGAGTTGAAGTTGTTTACATGTAAACTCGTAACAATTATTCTAGCTCT

GTCCCTCAGTTTTTTCACATCAACAAGCTCTAGTGACTTTCTTGATTGCA

TCTCTCAAAAAAACTTATCAAATATTATTTTCACTCCTAATGACACTTCA

TACTCAACTATTCTCCAATTTACCATCCCAAATCTTAGATTTAACACGCC

TAAAACCACAAAACCATTAGCAATAATCACACCTACAACGTATTCTCACG

TACAATCTACTATAATATGCAGCGTGCAATTCAAGCACCATGTTCGCATC

CGAAGTGGTGGTCATGACTACGAAGGTCTTTCGTATACTTCTTTCAATAA

CACCCCTTTTATACTTCTTGATCTCAACCAACTTCGGTCAGTAACGGTTG

ATTTAGATAGTAATACCACATGGGTCGAATCTGGTGCCACTCTAGGTGAA

CTTTTGTATTGGGTGTCTCGAAAAAGTAATATTCTTGGGATCCCAACCGG

CGAGTGTACATCGGTGGGCGTTGGGGGACAATTAAGTGGAGGAGGGTTTG

GAAATATGGCTAGAAAATATGGATTATTTTCGGATAATGCGGTTGACGCA

CTTATCATTGATGTAAATGGACGAATACTGGATAGAGATTCCATGGGTGA

AGATTTGTTTTGGGCAATTAGAGGAGGTGGGGGTGGAAATTTTGGAGTTG

TATTATCTTGGAAGATTAATCTAGTTTATGTTCCACCTAAAGTTACGGTT

TTTACTGTTTCTAAGATGTTAGATGAAAATGGTACCAAGATTGTTCACAA

GTGGCAATATATTGCGCATAATATAACGCAAGATTTGTTCATTAATCTTA

TAGTAAGTCCGGTTACCGTGTCAAATACAACGATTCTAGCAGTAACAATT

AACTCGTTGTTTTTGGGGATGAAAAACGAGCTTGTAGCAACAATGGATGT

AATATTTCCGGAATTAGGGTTACAAGAAAAGGATTGCATCGAAATGAGTT

GGATAGAATCGGTGGTTTACCATTCGGTTTATTTAAGAGGACAAAGTGTT

GATGCTCTAATAGAAAGAAGACCATGGCCTAAAAGTTACAACAAGTATAA

ATCAGATTATGTGAAGAAACCTATGTCAGAGAAAGCGCTTGAAAAACTGT

GGAAATGGTGTTTGGAAGAGAATTTGATTCTGGCGATCGAGCCACATGGT

GGAAAGATGAGCGAGATCGATGAGAGTTCGACTCCGTATCCGCATAGAAA

AGGGAATTTGTACATCATACAATATGTCATGCAATGGGATGAAGGGTATA

ACACAACTCAAAAGCATGTTGCTTCCATAAGAAGGGTATATAAGAAAATG

GCACCTTTTGTGTCCAAGAACCCTAGGGAAGCTTATGTGAACTTTAGAGA

TTTGGATTTGGGTACTAATGGTAATGCATGTGGTACAAGTGGTGCAAGCT

ATGTGCAAGCATTGAGATGGGGAAAAAAGTATTTTAAGGGAAATTTTAAG

AGGTTGGCAATAGTGAAAGGTAGAGTTGACCCAACTAATTTCTTCTGTAA

TGAACAAAGCATCCCACCTTATTCGTATTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 79, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO:79, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 79% to 95%, 82% to 97%, 81% to 98%, or 79% to 100% homology or identity to SEQ ID NO: 79. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises the nucleic acid sequence:

(SEQ ID NO: 89)

ATGACCAACTCGGAACTTGTTTTCATCCCATCTCCGGGAGCCGGCCACCT

ACCACCTACGGTGGAGCTAGCAAAGCTCCTCCTCCACCGCGAACCACAGC

TTTCGGTTACCATCATCATCATGAACCTCCCTCATGAAACAAAACCCACT

ACTGAAACTCGAATGTCCACTCCTCGTCTACGCTTTATTGACATACCTAA

AGACGAGTCAACAAAAGATCTTATCTCACGCCACACATTCATATCCGCCT

TCCTTGAACACCAAAAGCCACATGTTCGAAACATTGTCCGTTCAATCACC

GAGTCTGACTCGGTTCGGTTAGTTGGGTTCGTCGTAGACATGTTTTGTAT

TGCCATGATGGACGTCGCAAACGAGCTGGGTGCTCCAACTTATCTTTATT

TCACCTCCTCTGCCGCTTCACTTGGCCTCATGTTTTGCCTACAGGCCAAA

CGAGACGACGAGGAGTTTGATGTGACCGAGTTGAAGGACAAAGATTCGGA

ACTCTCCATTCCGTGTTACACCAACCCACTCCCAGCTAAGTTGTTACCTT

CGGTACTATTTGATAAGAGAGGTGGGTCAAAAACATTTATTGACCTCGCT

AGAAAGTATCGCGAGTCGAGGGGTATAGTTGTAAATACTTTTCAAGAACT

CGAAAGCTATGCTATTGAGTATCTTGCAAGTAGTAATGCTAACGTCCCAC

CGGTGTTTCCGGTGGGGGCGATACTAAACCAAGAAAAAAAGGTAAATGAT

GATAAGACGGAGGAGATTATGACATGGTTAAACGAGCAACCGGAGAGTTC

GGTGGTGTTTCTATGCTTCGGGAGCATGGGAAGCTTCGGTGAGGATCAAA

TTAAGGAAATAGCGCTTGCTATCGAAGAAAGCGGACAAAGGTTTTTGTGG

TCACTACGTCGTCCCCCTTCGAACGAAAATAAGTACCCGAAAGAATACGA

AAATTTTGGAGAGGTTCTTCCGGAAGGTTTCCTTGAACGAACATCGAGTG

TAGGGAAAGTGATAGGATGGGCCCCACAAATGGCAGTGTTGTCCCATTCT

TCAGTTGGTGGGTTTGTGTCACATTGCGGATGGAACTCGACACTCGAGAG

CATATGGTGTGGTGTACCGGTAGCTGCGTGGCCATTATATGCAGAACAAC

AACTTAATGCTTTTAAACTAGTGGTGGAGTTGGGCTTAGCGGTCGAGATT

AAGATTGATTATAGGAGTGAGAACGAGATTATTTTGACATCGAAAGAAAT

CGAGAGTGGGATTAGGAGGTTGATGAATGATGAAGAGTTGAGGATGAAAG

TGAAAGAGATGAAGGGGAATAGTAGGTTTGCAGTTTCAGAGGGTGGATCT

TCTTACGTATCCATTAGGCGTTTTATCGACCTTGTGATGACTAAGGAGTA

A.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 77%, at least 79%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 89, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 77% to 95%, 78% to 100%, 79% to 99%, or 77% to 100% homology or identity to SEQ ID NO: 89. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 90)

ATGCCGACCTCAGAACTTGTTTTCATCCCATCCCCCGGTGTCGGCCACCT

GTCGCCTACCATCGAACTCGTCAATCAACTCCTCCACCGCGACCAGCGCC

TGTCTGTCACAATCATCGTCATGAAGTTCTCTCTTGAATCAAAACACGAT

ACAGAAACTCCTACATCCACTCCTCGATTACGCTTCATTGATATCCCTTA

TGACGAGTCCGCTATGGCTCTCATTAACCCGAACACGTTCCTCTCCGCTT

TCGTCGAGCACAACAAACCTCATGTTCGAAACATTGTTCGTGACATTTCC

GAGTCTAACTCGGTTCGGCTCGCGGGGTTTGTTGTGGACATGTTTTGTGT

AGCTATGACGGATGTAGTGAACGAGTTTGAAATTCCAACCTATATTTATT

TTACCTCGACCGCGAACTTACTCGGACTCATGTTTTACCTTCAGGCCAAG

CGTGACGACGAGGGTTTTGATGTCACCGTGTTGAAAGACTCAGAATCAGA

GTTTTTGTCTGTTCCGAGTTATGTCAACCCGGTTCCAGCTAAGGTTTTAC

CTGATGCAGTTTTGGATAAGAATGGTGGGTCTCAAATGTGTCTGGATCTT

GCAAAAGGGTTTCGTGAGTCGAAGGGCATAATAGTAAATACATTTCAAGA

ACTCGAAAGGCGTGGAATCGAGCACCTTTTAAGTAGTAACATGAACCTCC

CACCTGTGTTTCCTGTGGGGCCTATATTGAACTTGAGAAATGCGCCAAAC

GATGGTAAAACGGCCGATATCATGACATGGTTAAATGACCATCCAGAGAA

CTCGGTTGTGTTCTTGTGTTTCGGAAGTATGGGAAGCTTCGAGAAAGAAC

AAGTGAAGGAGATAGCGATTGCCATCGAACAGAGTGGGCAACGGTTTCTA

TGGTCACTCCGTCGTCCAACATCGCTAGAAAAGTTTGAGTTTCCAAAGGA

TTACGAGAACCCGGAGGAGGTTTTGCCAAAGGGATTTCTTGAAAGGACAA

AAGGTGTGGGAAAGGTTATCGGGTGGGCCCCACAAATGGCGGTGTTGTCT

CACCCGTCAGTGGGAGGGTTCGTGTCCCACTGTGGGTGGAACTCCACATT

GGAGAGCATATGGTGTGGGGTCCCAATAGCGGCTTGGCCACTATATGCGG

AACAAAAAATTAATGCTTTTCAATTGGTGGTAGAGATGGGAATGGCAGCT

GAGATTAGGATCGACTATCGGACTAATACGAGACCGGGTGGTGGTAAAGA

GATGATGGTAATGGCTGAAGAGATTGAGAGTGGTATTAGGAAGTTGATGA

GCGATGATGAGATGAGAAAGAAAGTGAAAGGTATGAAGGATAAAAGTAGG

GCTGCTGTTCTTGAAGGTGGATCATCTCACACATCAATTGGGATTTTAAT

TGAGAATTTGGTGAGTATAACGATCTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 76%, at least 77%, at least 85%, at least 93%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 99, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 76% to 95%, 77% to 98%, 80% to 99%, or 76% to 100% homology or identity to SEQ ID NO: 90. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 91)

ATGGTGGGTCTCAAATGTTTTTGGATCTTGCAAAAAGGTTTTCGTGAGTC

GAAGGGCATAATAGTAAATACATTTCAAGAACTCGAAAGGCGTGGAATCG

AGCACCTTTTAAGTAGTAACATGGACCTCCCACCTGTGTTTCCTGTGGGG

CCGATATTGAACTTGAGAAATGCGCGAAACGATGGTAAAATGGCCGATAT

CATGACATGGTTAAATGACCAGCCAGAGAACTCGGTTGTGTTCTTGTGTT

TCGGAAGTAGGGGAAGCTTCAAGGAGGAACAAGTGAAGGAGATAGCAATT

GCCATCGAACAAAGTGGGCAACGGTTTCTATGGTCACTCCGTCGTCCAAC

ATCGATAGAAACGTTTGAGTTTCCAAAGTATTACGAGAACCCGGAGGAGG

TTTTGCCAAAGGGATTTCTTGAAAGGACAAAAAGTGTGGGAAAGGTTATC

GGGTGGGCCCCACAAATGGCGGTATTGTCTCACCCGTCAGTGGGAGGGTT

CGTGTCCCACTGTGGGTGGAACTCCACATTGGAGAGCATATGGTGTGGGG

TCCCAATAGCGGCTTGGCCACTATATGCGGAACAACAAACTAATGCTTTT

CAATTGGTGGTCGAGATGGGAATGGCAGCAGAGATTAGGATCGACTATCG

GACTAATACACCACTGGTTGGTGGTAAAGACATGATGGTAACGGCTGAAG

AGATTGAGAGAGGTATTAGGAAGTTGATGAGCGATGATGAGATGCGAAAG

AAAGTGAAAGACATGAAGGATAAGAGTAGAGGTGCAGTTTTAGAGGGTGG

GTCATCTCATACATCAATTGGGAATTTAATTGATGTTTTGGTGAGTATAA

CGATCTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 78%, at least 80%, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 91, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 79% to 95%, 78% to 100%, 80% to 99%, or 79% to 100% homology or identity to SEQ ID NO: 91. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 92)

ATGGCGACCAACAACCTCCATTTCCTTCTAATTCCCCATATAGGTCCAGG

CCACACTATTCCCATGATAGATATGGCTAAACTTCTTGCAAAACAACCAA

ATGTAATGGTTACAATAGCTACAACACCTCTTAATATCACCCGTTACGGG

CACACTCTCGCAGACGCCATCAACTCGTTTCGCTTCTTTGAGGTTCCATT

TCCGGCAGTTGAGGCTGGATTACCTGAAGGATGTGAAAGCACGGATAAAA

TCCCAAGTATGGATCTAGTACCGAACTTTTTAACCGCGATTGGTATGCTA

GAACAAAAGCTAGAAGAGCATTTTCACTTGCTAGAGCCTCGTCCGAATTG

TATTATTTCTGATAAGTACATGTCGTGGACGGGTGATTTTGCTGATAAGT

ATCGGATCCCTAGAATTATGTTTGATGGAATGAGCTGTTTTAACGAGTTA

TGTTACAACAATTTGTATGAAAACAAGGTGTTTGAAGGGATGCATGAAAC

AGAACCATTTGTTGTCCCTGGTTTACCCGATAAAATTGAGCTAACACGAA

AACAGCTCCCACCTGAGTTTAACCCGAGCTCGATTGATACAAGTGAGTTT

CGTCAGCGGGCTAGGGACGCTGAGGTGAGGGCTTATGGAGTTGTGATCAA

TAGTTTTGAGGAGTTGGAACAAGAATATGTTAATGAGTATAAGAAGTTAA

GAAAGGGTAAGGTTTGGTGTATCGGCCCGCTGTCACTGTGCAATAGTGAC

AATTCGGATAAAGCCCAAAGAGGAAATATAGCGTCAGTCGATGAAGAAAA

ATGTTTAAAATGGCTTGATTCTCATGAAGCCGACTCAGTAGTTTACGCTT

GTTTTGGTAGCCTTGTTCGGGTCAACACCCCACAACTAATTGAGCTTGGT

TTAGGCCTAGAAGCATCAAATCGCCCGTTCATTTGGGTGGTTAGATCGGT

TCATAGAGAAAAAGAGGTCGAGGAATGGCTAGTGGAAAGTGGTTTTGAGG

AGAGAATTAAAGATAGAGGTTTAATAATCCGAGGTTGGGCCCCACAAGTA

CTTATCTTGTCTCACCCTTCTATTGGAGGGTTTTTAACGCATTGCGGTTG

GAACTCGACCCTAGAATCAGTCTGTGCAGGTGTTCCAATGATCACATGGC

CTCAATTTGCAGAGCAATTTATCAACGAGAAGCTAATAGTGCAAGTGTTG

GGGATTGGTGTGGGTGTTGGAGTTGATTCTGTTGTCCATGTGGGCGAAGA

AGATAGATCTGGGGTGAAAGTGAAGAGGGAGAGTGTTACGAAGGCTATTG

AGAAAGTCATGGATGACGAGATTGATGGAAATGAGAGACGGAGGAGATCG

AAAGAGTTTGGAAAGATAGCTAATAACGCGATTAAAGAGGGAGGGTCTTC

ATACCTTAACTTGACTCTGCTAATTCAGGACATAATGCGTTATGCAAATG

CAGATGCTTCAAGCTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 87%, at least 92%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 92, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 87% to 100%, 88% to 99%, 89% to 99%, or 87% to 100% homology or identity to SEQ ID NO: 92. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 93)

ATGGAAAAAACACCTCATATAGCCATTGTACCAAGTCCAGGAATGGGCCA

CTTGATCCCTTTAGTTGAGTTTGCTAAAAAACTAAAAAATCACCACAACA

TACATGCAACTTTCATCATCCCAAATGATGGACCTTTATCTATTTCTCAA

AAGGTTTTTCTTGATTCACTTCCTAATGGTTTAAACTATCTCATTCTACC

TCCGGTAAATTTTGATGATTTACCACAAGATACCCAAATCGAAACTCGAA

TTAGTCTAATGGTAACACGGTCTCTTGATTCGCTACGTGAAGTGTTTAAG

TCATTAGTTGTGGAAAAAAATATGGTTGCTTTGTTTATTGATCTTTTTGG

GACAGATGCATTTGATGTTGCTATTGAATTTGGTGTTTCACCTTATGTGT

TCTTTCCATCAACTGCTATGGCTTTATCTTTGTTTCTATATTTGCCTAAA

CTTGATCAGATGGTTTCATGTGAGTATAGGGAGCTTCCTGAACCGGTTCA

AATTCCAGGTTGTATACCGGTTCGTGGACAAGACTTGGTTGACCCGGTTC

AAGATAGAAAGAATGATGCATACAAATGGGTGCTTCATAATGCAAAGAAG

TATTCAATGGCTAAGGGTATAGCGGTAAATAGCTTCAAGGAGTTAGAAGG

TGGAGCTTTGAATGCTTTGCTAGAAGATGAACCGGGTAAGCCAAAAGTTT

ATCCGGTCGGACCGTTAGTACAAACCGGTTTTAGTTGTGATGTTGATTCG

ATAGAGTGCTTGAAGTGGTTAGATGGTCAGCCATGTGGTTCTGTTTTGTA

TATATCTTTTGGAAGCGGTGGGACCCTTTCATCCAGTCAACTTAATGAGT

TAGCTATGGGTTTGGAGTTGAGTGAACAACGGTTCATATGGGTGGTTAGA

AGCCCGAACGATCAACCAAACGCCACGTACTTTGATTCTCATGGTCACAA

AGACCCTCTTGGTTTTTTGCCCAAAGGGTTCTTGGAAAGAACCAAAGGAA

TTGGGTTTGTGATCCCTTCTTGGGCTCCACAAGCCCAGATCCTGAGTCAC

AGTGCCACAGGTGGATTTTTAACCCACTGTGGTTGGAACTCAATTCTCGA

GACTGTAGTCCATGGTGTGCCGGTGATTGCTTGGCCACTTTATGCCGAGC

AAAAGATGAATGCAGTGTCTTTAACCGAGGGTATAAAAATGGCGTTAAGA

CCCACGGTTGGTGAAAATGGGATTGTGGGTCGCTTAGAGGTTGCGAGAGT

TGTGAAGAGTTTACTGGAAGGAGAAGAAGGGAAGGCGATTAGGAGTCGAG

TTCGTGATCTCAAGGATGCTGCTGCTAATGTTCTTAGTAAAGATGGGTCT

TCTACAAAAACTTTAGATCAATTGGCTGTACAGTTGAAAAAACAAGAATT

AAGCTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 87%, at least 92%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 93, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 87% to 100%, 88% to 99%, 89% to 99%, or 87% to 100% homology or identity to SEQ ID NO: 93. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 94)

ATGACTCAAAAGCAAATGCAAATGCAACCTCACTTTCTCTTAGTAACATA

TCCCGCACAAGGTCATATTAACCCGTCTCTCCAGTTCGCTGAACGTCTCA

TTCGGTTGGGTGTCAAAGTCACCTTCACAACAACTGTCTCTGCTTACCGC

CGAATGAGTAAAGCGGGCAACATCTCAGAGTTTTTAAATTTTGCTGCTTT

TTCAGACGGCTTTGATGACGGTTTCAACTTCGAAACAGACGATCATGGTC

TCTTCTTAACTCAATTGAGAAGCAGGGGAAAAGATAGCTTGAAAGAAACA

ATTCTTTCAAATGCTAAAAATGGAACTCCAATTAGTTGTTTGGTTTACAC

ACTCCTACTCCCTTGGGCTCCTGAGGTGGCACGTGGCCTAAACGTGCCCT

CAGCCTTTCTTTGGATTCAACCAGCTTCTGTTTTACGACTTTACTATTAC

TACTTCAATGGGTACAATGAACTCATCGGTGACGATTGTAATGAACCTTC

ATGGTCCATTCAATTACCAGGGTTACCATTGCTCAAAAGTCATGACCTTC

CCTCCTTTTGTCTCCCTTCAAATCCTTACAGTAATGTACTGGCTCTAGTC

AAAGAGCATTTAGATATGCTGGATCTGGAAGAGAAGCCTAAAATACTTGT

GAATAGTTTTGATGAGTTGGAGAGGGAGGCGTTGAATGAAATTAATGGAA

AACTAAAAATGGTCGCCGTAGGGCCTTTGATTCCATCAGCTTTTTTGGAT

GGACAAGATGCATCTGACAAATCTTTTAGGGGAGATTTGTTTGAAACATC

CAAAGATTATTTGGAATGGATGAATACAAAGCCTGAAGGGTCCATTGTTT

ACATATCTTTTGGTAGTCTTTTAGTGTTCTCAAAGATACAAAAGGAGGCA

ATGGCACATGCTTTGTTAGAGTGCGGGAGGCCGTTCTTGTGGGTGATAAG

AGATGGAGAACAAGGAGAACAACTAAGTTGTATTGAGAAATTGGAACAAT

TAGGTTTGATAGTCCCATGGTGTAGTCAACTAGAGGTATTATCACACCCT

TCTTTAGGTTGTTTTGTGACACATTGTGGTTGGAACTCGACTTTAGAGAG

TATAGTTTGTGGAGTTCCTGTGGTGGCATTTCCTCAATGGACAGATCAGA

CGACAAATGCAAAGCTTCTAGAAGACGTATGGGGAACAGGGGTGAGAGTG

ACAACTAATGAAGACGGGGTTGTTGAAAGCGAGGAGATAAGAAGGTGCAT

CGAAATGGTAATGGGAGGCCGTGATAGTGAATCAACAATGAGAAAGAATG

CTAAGAAGTGGAAGGATGTGGGAAGAGAGGCTATGAAAGAAACAGGATCT

TCTTATATGAATCTCAAGGCTTTTATTAAAGAAGTGAATGATGGTGAATC

AACCATCAAAACTGAAATTGTTTCAACTATATGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 80%, at least 87%, at least 93%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 94, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 80% to 98%, 81% to 99%, 85% to 99%, or 80% to 100% homology or identity to SEQ ID NO: 94. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 95)

ATGACTAAAATACAACAGCAACCTCACTTTCTCTTAGTAACATATCCCGC

ACAAGGTCATATTAACCCGTCTCTCCGGTTCGCCGAACGACTCATTCGGT

TGGGTGTCAAAGTCACCTTCACAATAACTGTCTCTGCTTACCGCCGAATG

AGTAAAGCGGGCCACATCTCAGAGTTTTTAAATTTTGCTGTTTTTTCAGA

CGGCTTTGATGACGGTTTCAACTCCAAAACAGACGATTATGGTCTCTTCT

TAACTCAATTCAGAAGCAGGGGAAAAGATAGCTTGAAAGAAACAATTCTT

TCAAATGCTAAAAACGGAACTCCAGTTAGTTGTTTGGTTTACACACTCCT

ACTCCCTTGGGCTCCTGAGGTGGCACGTGGCCTAAACGTGCCCTCAGCCT

TTCTTTGGATTCAACCAGCTTCTGTTTTACGACTTTACTATTACTACTTC

AATGGGTACAATGAACTCATCGGCGACGATTGTAACGAACCTTCATGGTC

CATTCAATTACCAGGGTTACCATTGCTCAAAAGTCGTGACCTTCCCTCCT

TTTGTCTCCCTTCAAATCCTTACGCTGATGTACTGACTTTAGTCAAAGAG

CATTTAGATGTGTTGGATTTGGAAGAGAAGCCTAAAATACTTGTGAATAG

TTTTGATGAGTTGGAGAGGGAGGCGTTGAATGAAATTGATGGGAAACTAA

AAATGGTTGCCGTAGGGCCTTTGATTCCATCAGCTTTTTTTGGATGGACA

GGATGCATCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 77, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 95, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 77% to 95%, 82% to 97%, 81% to 98%, or 77% to 100% homology or identity to SEQ ID NO: 95. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 96)

ATGGGTTCATGGCGGAATTCAAGAACAACGTCTACAAAGTTTTTATGGTT

GATTTTACCGTTGATGGTGGTGACGGTGATTATAGGGGTAAAAAAGTCAA

ATTATGGGTCGAAGTATAATTATCCTTGGGTTTGGAGTTCAGTGATTAAT

TCTTATTCTTCTTCTGCGGTTAAAGAAGATGTAACGGTGGTGGCTGAAGG

TCCTGTTGAATCATTTGGGTTGCGGTCAACGGTGGTCAACGGTGGTGGTG

TGGTGGCGGAAGGGCCGTCGGAAGATTTTGGTTTTAATTCTTCTTATCCA

CCGTTGGCTATGGAAGATGAAATGGATGTTGAGCTACCTGCTATTGCCAA

GGAAGATGACTTGAACGCGACGTTGAGTGGACCCGACCTTTTTGTGTCTG

CAAATCAAACTGGCGGACTTCATGTTGATATTGGAATCAACAGTAAGTAT

ACCAGTTTGGATAAGCTTGAAGCCCGCTTAGGTCAGGTTCGAGCTGCAAT

AAAAGAAGCCGAATCAGGAAATAGAACTTACGATCCGGATTATGTACCAG

AGGGTCCTATGTACTGGCATGCAGCCTCATTTCACAGGAGTTATTTGGAG

ATGGAAAAGCAATTTAAGGTGTTTGTATATGAAGAAGGAGAACCACCAAT

ATTTCATAACGGTCCTTGCAAAAACATATATGCAATGGAAGGTAACTTTA

TCTACCATATGGAAACAACCAAGTTTAGGACAAAAAACCCCGAAAAAGCT

CACACGTTTTTTCTCCCAATGAGTGCTGCAATGATGGTGAGGTTTATCTT

TGAGCGTGATCCAAATGTTGACCATTGGCGTCCTATGAAGCAAACAATTA

AAGATTATGTTGATCTTGTGGGTGGTAAGTACCCATTTTGGAATCGAAGC

TTAGGAGCCGATCACTTTACTGTTGCGTGCCACGATTGGGTGAGTAAAGT

CTTTTATCCCATCATTTTCATGCTTTTACTAGTATTTATCTTCAGAATGT

CGACTGGATGCTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 82%, at least 85%, at least 89%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 96, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 82% to 95%, 83% to 98%, 82% to 99%, or 82% to 100% homology or identity to SEQ ID NO: 96. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 97)

ATGTCAACCGTTGAGGTTGCAAAGTTACTTGTGAATCGAGATCATCGTCT

CTTCATAACATTCCTTATCATTCAGCCTCCTAGCTCGGGTTCTGGCTCAG

CTATCACCACCTACATCGAATCATTAGCTGAGAAAGCTATGGACCGCATA

TCCTTCATTGAGCTACCTCAAGATAAAATCCCACCACCACGTTACCCGAA

ATCCCTGCCAACTGCAGAATCGAAAGCTCATCCCCTTATTTTCATGATTG

AGTTCATTAAGTGTCACTGCAAATATGTTAGAAACATTGTATCTGACATG

ATAAGTCAACCGAGTTCGGGTCGGGTAGCTGGGTTGGTAATCGACATGCT

TTGTTTCAGCATGATGGATGTCGCTAATGAGTTCAACATTCCAACCTATG

TATTTGTCACTTCTAATGCTGCTTTTCTTGGATTTTATTTATATGTCCAG

ATACTCTCTAATGATCAGAACCAAGACGTTGTTGAGCTGAGCAAATCTGA

TACCGAGATATCGGTTCCAGGTTTTGTAAAGCCGGTGCCAACGAAAGTCT

TCTGGACTGTTGTCCGCACTAAAGAAGGACTGGACTTTGTTTTGTCATCT

GCCCAGAAACTTAGACAAGCCAAAGCAATCATGGTTAATACCTTCTTGGA

GTTGGAAACACACGCAATCAAGTCGCTGTCTGATGACACCAGCATCCCGC

CTGTGTATCCAGTGGGACCGATACTCAATTTAGAAGGTGGTGCTGGCAAA

ACGTTCGACAATGACATTAGCAGGTGGTTGGACAGTCAACCGCCTTCCTC

GGTGGTGTTCTTGTGCTTTGGAAGCCACGGATGTTTTGATGAGATCCAAG

TGAAGGAGATAGCACATGCTTTAGAGCAGAGTGGCCACCGTTTCTTGTGG

TCCCTACGTCGACCTCCATCAGATCAAACATTAAAAGTTCCCGGTGATTA

CGAGGATCCAGGAGTGGTATTACCGGAAGGATTTCTTGAGCGAACTGCTG

GACGTGGGAAAGTAATTGGGTGGGCCCCGCAGGTGATGGTGCTGGCTCAC

CGTGCAGTTGGAGGCTTCGTGTCCCACTGTGGGTGGAACTCGTTGTTGGA

GAGTTTGTGGTTCGGCGTACCAACGGCAACATGGCCGATCTATGCTGAGC

AGCAGATGAATGCGTTTGAAATGGTGGTGGAGCTGGGACTGGCTGTGGAG

ATAACATTGGATTATAGGAATGATATGGATATGTTCATTGTCACCGCACA

GGAGATAGAAAGTGGTATAAGAAAGGTGATGGAGGATAATGAGGTAAGAA

CAAAAGTGAAAGAGAGAAGTGAGAAGAGTAGAGCAGCAGTGGCGGAGGGG

GGGTCATCGTATGCATCTGTTGGTCATCTTATTAAAGAATTTACAGGAAA

CATCTCCTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 79, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 97, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 79% to 95%, 82% to 97%, 81% to 98%, or 79% to 100% homology or identity to SEQ ID NO: 97. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 98)

ATGTCATCATTCATCAACTTTGTTGAATCCACAACACAACTTCAACCACA

ATTCGAACAACTCATCCAAACACTTCTTCCCATAACTGCGATAATATCGG

ATGGTTTTTTGATGTGGACACAAGATTCCGCCGAAAAATTCAATATCCCA

CGTCTGGTTTTTTATGGGACAAACATATTTTTCATGACTATGTGTAACAT

TATGGCACAATTTAAGCCACATGCGGCTGTTAATTCTGATGATGAGGCGT

TTGATGTACCCGGTTTCACCAGGTTTAAGTTGACGGCTAATGATTTTGAG

CCGCCTTTTAATGAGGTTGAACCGAAAGGTTCAATGTTGGATTTTTTATT

GGAGCAACAAAAGGCTATGGTTAGGAGCCATGGGTTGGTGGTTAATAGTT

TTTATGAGATTGAACATGAGTTTAATGTTTATTGGAATCAGAACTATGGA

CCTAAAGCTTGGTTAATGGGACCATTTTGTGTAGCTAAGCCATATGCATC

AAACGTCATGGATTCCGAGATATCGACTAAGGTGGTGAAAAAATCAGCAT

GGATCCAGTGGCTTGACAGGAAGCTTGCAGCGAACGAGCCAGTGTTATAC

ATCTCATTTGGAACACAGGCAGAGGCGTCTATGGAGCACTTACACGAGGT

CGCTATTGGTTTGGAACGATCAAATGTAAGCTTCATTTGGGTGGTAAAAG

CGAAGCAGATGCAATTAATTGGAGCAGGGTTTGAAGAGAGGGTGAAGGGG

AGAGGAAAAGTGGTGACAGAATGGGTGGATCAGATGGAAATCTTGAAACA

TGAAATTGTAAGCGGGTTTTTAAGTCATTGTGGGTGGAACTCACTGCTAG

AGAGTATGTGTGTGGGTGTGCCGGTGCTTGCAATGCCGTTGATGGCGGAT

CAACTCTTAAATGCAAGGTTGGTTGTGGAGGAGATTGGGATGGGGCTACG

GTTGTGGCCGAGGGGTATGGTGGCACGTGGGATAGTTGGGGCGGAGGAAG

TCGAGAAAATGGTGGTGGAGTTGATGGAAGGGGAAGGTGGGAGAAGGGTG

CGGAAAAGGGTCATCGAGGTTAGAGAAATGGCATATGGTGCGATGAAGGA

AGGAGGGTCATCATCGAGGACATTAGACTCGTTGATTGATCATGTTTGTG

AAGCCTTTCATAAGACGGTTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 78, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 98, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 78% to 95%, 82% to 97%, 81% to 98%, or 78% to 100% homology or identity to SEQ ID NO: 98. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 99)

ATGGGGAGCTTGAAGAAAGGTGCACATATACTAATATTCCCATTC

CCAGCACAAGGTCATATGCTCCCACTCCTAGACCTAACTCACCAC

CTAGCCACCAATGGGTTAACCATAACCATATTAGTCACACCCAAA

AACCTACCAATCTTGAACCCACTTTTATCTTCATCTCCAAACATC

CAACCACTAGTCTTCCCTTTCCCACCTCACCCAAGACTTCCACCA

CATGTTGAAAATGTTAAAGACATAGGTAACCATGCAAATGTCCCA

ATCACAAACTCACTAGCCAAATTACAAGACCAAATAATCCAGTGG

TTTAACTCCCACCATAACCCTCCTGTTGCCATCATCTCAGATTTC

TTTCTTGGATGGACCCAACACCTTGCAAACAAACTTGGTATCCCT

CGTGTCGGGTTTTTTTCTTCTGGTGCTTACTTGACTGCTGTTCTT

GATTATGTTTGTCATAATATTAAAACTGTTAGGTCTCAAGAGGAG

ACTGTTTTTCATGACTTGCCAAATTCTCCTTGTTTTAAATTCGAG

CATCTTCCGGGTTTGGCCCAGATTTATAAAGAGTCCGACCCGGAA

TGGGAATTGGTTCTTGATGGTCATATTGCGAATGGGTTAAGTTGG

GGTTGGATTGTGAATACTTTTGATGGGTTGGAGTCTCGGTATATG

GAGTATCTGACAAAGAAAATGGGTGTCGGACGGGTTTTTGGTGTC

GGGCCAGTTAATTTGTTAAACGGGTCGGATCCCATGACCCGTGGG

AAATCGGAATCCGGGTCTGATTCCGGTGTGTTGAACTGGCTCGAT

GGAAAACCCGATGGGTCGGTTTTGTATGTGTGTTTTGGAAGTCAA

AAGTTTCTTACTAATGACCAAATGGAGGGATTGTCAATTGGGCTT

GAACAAAGTGGGGTCCATTATGTTTGGGTTGTGAAAGACGAACAA

GGTGATGCAATTAGGTCCGGGTCGGGTAGAGGACTAGTGGTAACG

GGTTGGGCCCCGCAAGTTTCAATATTGGGTCATGGAGCGGTGGGT

GGGTTTTTGAGTCATTGCGGGTGGAACTCTGTTTTGGAAGCAATT

GTAAATGGAGTTATGATATTGGCTTGGCCAATGGAGGCTGATCAA

TTTGTTAATGCTAAGTTGTTAGTGGATGACCATGGTATAGGGGTG

TGGGTTTGTGAGGGGCCGAATACGGTTCCTGATTCAACCGAGTTG

GCTCGTAAAATTGGTGAGTCAATGAGTACGGATAAGAGTGAGAAG

GTAAAGGCGAAAGAAATGAAAAACAAAGCAAATGAAGCAGTTAAA

GAAGGTGGGAGCTCATCAATGGAATTAAGCAGGCTTGTTAAGGAG

CTGTCTAACTTTGAGACAAATGGGCCATGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 82, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 99, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 82% to 95%, 82% to 97%, 83% to 98%, or 82% to 100% homology or identity to SEQ ID NO: 99. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 100)

ATGGATACCCAAACACAAGTCAAGAAACAAAAACTTGAAACCATG

GAACATAAAACATCATCCGCCGAAATCTTCGTGCTACCATTTTTT

GGTACGGGTCATATAAACCCAGCAATGGAGCTTTGCCGGAACATT

TCATCACATAATTACAAAACTACCCTCATCATCCCTTCACATCTT

TCTTCATCTATTCCTTCTCCCTTTTCTTCAACTTTACTTCATGTT

GCTGAGATCCCTTTCACTGCTTCTGACCCGGAACCCGGATCCGGA

AGAGGGAACCCACTTGATGCCCAGAACAAGCAAATGGGTGAAGGG

ATTAAGGCGTTTATGTCTGCAAGATCTGACGGATCAAAACTACCC

ACGTGTGTTGTTATTGATGTCATGATGAACTGGAGTAAAGAGATA

TTTGTTGATTACCAGATTCCTATTGTCTCTTTTTTTACTTCTGGA

GCTACTAATACTGCTATGGGTTATGGTAGGTGGAAAGCTAAAATT

GGTGATCTGAAGCCCGGGGAGACCCGTGTGATCCCCGGACTTCCT

ACTGAAATGGCCGTTACTTTTGCGGATTTAAATCAAGGTCCTAGA

GGCCGTGGGCCTCGGCCGGATGGGTCAAGGCCTGACGGGCCAAGG

TCTGGACCACCTGGTGGGATGAGGTCCGGACCACCTCACGGGATG

AGGGGTGGGGGACGAGGTGGGCGGGGCGGTGGACGACCCGGCCCG

GATGCGAAACCACGTTGGGTAGATGAAGTGGACGGGTCGGTAGCT

TTGCTTATCAACACGTGTGACAATCTCGAGCGTGTGTTTATTGAT

TACATTGCTGAAGAAACCAAGATTCCCGTTTATGGTGTTGGCCCG

TTGCTGCCCGAAAAGTATTGGAAGTCAGCGGGTTCGTTGCTTCGT

GATCATGAAATGAGGTCTAACCATAAAGCGAATTACTCGGAAGAT

GAGGTGTTTCAATGGCTAGAATCGAAACCAGTTGGGTCGGTTATT

TACATATCGTTTGGGAGTGAAGTTGGCCCGACTATAGACGAGTAT

AAAGAGTTAGCTGGATCATTGGAAGGATCGAATCAGAATTTCATT

TGGGTGATCCAGCCCGGTTCGGGGATAACGGGCATGCCAAGATCG

TTTTTGGGCCCGGTTAATACGGATAGTGAGGAAGAAGAGGAAGGG

TATTATCCTGAGGGATTAGATGTTAAAGTTGGGAACAGGGGTTTG

ATCATCACTGGATGGGCTCCACAGTTGTTGATTTTGAGCCACCCA

TCTACAGGCGGGTTCTTATCACATTGTGGGTGGAATTCAACTGTT

GAGGCGATTGGGCGAGGTGTTCCGATATTGGGTTGGCCCTTGAGG

GGTGATCAGTTTGATAATGCGAAACTTGTGGCGAATCATTTGAAA

ATTGGGTTTGCGATGTCAAGTGTGGCGAGTGAAGGCGGACGACCT

GGGAAGTTCAACAAGGAGACTATAACAGCAGGGATTGAGAAACTA

ATGAATGATGAAGATGTGCATAAACAGGCAAAGAAACTTAGTAAA

GAATTTGAGAGTGGGTTTCCAGTGAGTTCAGTTAAAGCATTGGGT

GCTTTCGTGGAGTCTATTAGCCAGAAAGCAACCTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 74, at least 80%, at least 85%, at least 87%, at least 93%, or at least 99% homology or identity to SEQ ID NO: 100, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 74% to 95%, 75% to 97%, 76% to 98%, or 74% to 100% homology or identity to SEQ ID NO: 100. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 101)

ATGTCACTCGTGACTAATAACCCACATTTACTAGTCTACCCATTA

CCTACCTCCGGCCATATCATTCCGTTACTCGACCTGACCGACCTT

CTTCTCCGCCGTGGCCTCACCATCACCGTCGTGATATCCACCACA

GACCTTACGCTTCTCGACACTCTCCTATCCTCACACCCCACGTCT

CTACACAAACTTTACTTCCCCGACCCCGAAATCGGCCCATCTTCT

CATCCCGTTATTGCCAGAATAATTGCCACCCAAAAACTATTTGAT

CCAATTGTTAAATGGTTTGAATCGCACCCTTCGCCTCCAGTCGCC

ATCATTTCCGACTTCTTTCTTGGGTGGACTAATGAACTTGCATCA

CGTTTAGGTATTCGACGTGTGGTGTTTTCACCTTCGGGAGCTCTT

GGTCATTCCATTTTACAAAGTTTGTGGCGTGACGTGGCGGAGATC

AATGCAAAAAATGTTGATGGAAATGGAAACTACTCGATTTCTTTT

ACCGATATACCAAACTCGCCCGAATTTCATTGGTGGCAGTTGTCA

CAACTTTTGCGTGTTCATAGGGAGGGAGATCCGGACTTCGAATTT

TTTAGGAATGGAATGTTGGCTAATACGAAAAGTTGGGGTATTGTT

TACAACACATTTGAAAGGATTGAAAAGGTTTACATTGACCATGTG

AAGAAACAAATAGGTCATGATCGGGTATGGGCAATAGGCCCATTA

CTTCCCGAAGAACATGGCCCAGTTGGTAGCACCGCACGTGGTGGG

TCCAGTGTAGTGCCACCTCATGACCTTCTCACGTGGTTGGACAAA

AAGCCCCATGACTCGGTCGTATATATATGTTTTGGGAGTCGATTG

ACGTTAAGTGAGAAGCAAATGAGTGCATTAGCAAGTGCACTCGAG

CTCAGTAACGTTGATTTTATTTTGTGTGTGAAGGCAAGTGGTTCG

AGCTTCATTCCTAGTGGGTTCGAAGATCGAGTGGTGGGTCGGGGG

TTCGTAATCAAAGGTTGGGCCCCACAGTTGGCGATATTGAGACAT

CGGGCTGTGGGGTCGTTTGTGACTCATTGTGGGTGGAACTCAACA

TTGGAAGGTGTTTCATCAGGAGTGATGATGTTGACGTGGCCAATG

GGTGCAGACCAATATGCAAATGCTAAGCTATTGGTCGACCAGTTA

GGTGTTGGGAAACGAGTTTGTGAAGGTGGACCCGAGAGTGTTCCT

GATTCAACTGAGTTGGCTCGGTTGTTGGAAGAGTCACTGAGTGGT

GATACATCCGAGCGAGTTAAAGTCAAGGAGCTAAGTCGGGAAGCT

AACACAGCTGTGAAAGAAGGAACTTCAATAAGAGATTTRGAACAT

GTTCGTTAACCTTTTATCCGAGCTCTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 80, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 101, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 80% to 95%, 82% to 97%, 81% to 98%, or 80% to 100% homology or identity to SEQ ID NO: 101. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 115)

ATGGCAACCCAAGTCAAAACCGAGGAGAAGCATTTGAAGGTAGAA

ATCATAAACAAAACCTATGTGAAACCTGAAACACCACTAGGAAGA

AAAGAGTGTCAATTGGTCACATTTGATCTTCCTTATATAGCCTTC

TACTACAACCAAAAGTTGATCATCTATAAAGGTGGTGTCGAGGAG

TTCGAGGATACCGTCGAGAAACTGAAAGACGGGTTAAAGGTAGTT

TTGGGAGAGTTTCATCAATTGGCTGGAAAATTAGACAAAGATGAT

GACGGGGTGTTTAAGGTAGTGTACGATGATGACATGGATGGGGTG

GAGGTGCTTTCTGCGGTCGCGGAAGACACTGCGACCGCAGATTTG

ATGGACGAAGAAGGGACCATCAAGCTTAAGGAGTTGGTCCCTTAT

AATAGTGTTTTGAACATAGAGGGGCTTCATCGTCCGCTTTTATCG

ATTCAGATAACAAAACTAAAAGATGGGCTTGTACTGGGCTGTGCG

TTCAACCACGCGATTTTAGACGGTACATCCACCTGGCACTTCATG

AGCTCCTGGGCCCAAATTTGCTCCGGATCCAAATCCATTTCAGCG

GCGCCTTTCCTTGACCGTACCCAAGCGCGTAACACGCGCGTGAAA

CTCGATCTCACCCCTCCCGCCCAAACTAACGGCAATTCAAACGGC

GACACTAACGGTGATGCGAGCGCCACGAAGCCACCAGCACCGGCA

CCGTTAAGAGAAAAAATCTTCAAATTCTCAGAGTCAGCAATCGAC

AAAATCAAAGCAAAAATCAATGCGAATCCACCGGAAGGATCAACC

AAGCCATTCTCCACATTTCAATCGCTCTCCACACACATATGGCAC

GCAGTTACACGCGCTCGCAATCTAAAACCGGAAGACTACACCGTT

TTCACTGTTTTCGCCGATTGCCGGAAACGTGTCGATCCTCCGATG

CCGGATAGCTATTTCGGAAACCTAATTCAAGCGATCTTCACCGTC

ACCGCTGCCGGATTATTGCAGGCGAATCCACCGGAATTCGCGGCG

TCAATGATACAAAAAGCGATTGATATGCACGATGCGAAAGCAATT

GAAGCGCGTAACAAAGAATGGGAAAGTAATCCGATTATATTTCAA

TACAAAGACGCCGGAGTTAATTGTGTTGCGGTTGGGAGTTCACCT

AGGTTTAAGGTTTATGATGTGGATTTCGGGTTTGGTAAACCCGAA

AGTGTTCGGAGCGGGGCGAATAACCGGTTTGATGGTATGGTTTAT

TTGTATCAGGGAAAAAGTGGTGGAAGGAGTATTGATGTGGAGATT

AGTTTGGATGCAAGTGCAATGGGAAATCTTGAAAAGGATAAGGAA

TTTCTTATCCAAGAATAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 84%, at least 87%, at least 90%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 115, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 84% to 100%, 88% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 115. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 116)

ATGGCTTCTCTTCCTCTCTTAACTGTTCTTGAACAATCCCATGTA

TCACCACCGCCAGCCACCGTAGTCGATAAATCGTTGTCGCTAACC

TTTTTCGATTTCCTGTGGCTAACTCAACCTCCAATTCACAATCTT

TTCTTTTACGAGTTTTCAATCGACGAAACTCAGTTCGTGGAAACT

ATCGTTCCTAGTCTTAAAAACTCGTTATCAATCACTCTTCAACAT

TTTTACCCGTTCGCCGGTAACCTTATCTTATTTCCTGATAACAAA

AGGCCTGAAATTCGTTACGTTGAAGGTGATTATGTCATGGTTACA

TTTGCAAAATCTAGCCTTGACTTCAATGAACTAGTAGGAAACCAT

CCTAGAGATTGTGACCAGTTTTATGATCTTATTCCTCCATTAGGT

GAAAGTGTGAAAACTTCTGAATTTCGAAAAATCCCACTCTTTTCG

GTCCAGGTGACGTTTTTTCCACAAAAAGGCGTATCGATTGGTATG

ACGAATCATCATAGTCTTGGCGATGCTAGCACTCGGTTTTGTTTC

TTGAACGCGTGGACATCGATTTCTAGATCTAGTTCAGATGAGTCA

TTTCTAGCAAACGGAACTAAACCGTTTTACGATAGAGTGATAAGT

AACCCGAAACTAGATCAAAGTTATCTAAAATTTTCCAAGATCGAT

ACTCTTTACGAGAAGTATCAACCTTTAAGCCTCTCTAGACCATCT

AATAAACTTCGTGGCACGTTTATCTTGACGCGAAAAATCCTAAAC

GAGTTGAAAAAAAGTGTGTCAATTAAACTACCAACTTTATCATAT

GTATCATCTTTTACGGTTGCATGTGGTTATATTTGGAGTTGCATA

GCGAAATCACGAAACGATGATCTACAACTATTCGGGTTCACTATT

GATTGTAGGGCACGTTTGGATCCACCGGTTCCATCAACTTATTTT

GGGAATTGTGTCGGGGGTTGTATGGCGATGGCAAAAACAACGTTG

TTAACCGAAGACGATGGATTTATAACGGCTGCTAAATTGCTTGGA

GAAAGTTTACACAAGACGTTGACCGAATCGGGTGGAATCGTGAAA

GATATAGAAGTGTTTGAAGATTTGTTTAAGGATGGATTACCAACA

ACTATGATAGGAGTTGCGGGAACACCAAAGCTTAAGTTTTATGAG

ACGGATTTCGGGTGGGGGAACCCGAAAAAGGTGGAAACGATTTCG

ATTGATTATAACATGTCGATTTCTATGAACGCTTGTAGAGAATCG

AAGGATGATTTGGAGATTGGTGTTTGCCTTATGAATACTGAAATG

GAAGCTTTTGTTCGTTTATTTGATGAAGGATTAGAATCATACGTT

TAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 77%, at least 85%, at least 93%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 116, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 77% to 100%, 80% to 100%, 85% to 100%, or 93% to 100% homology or identity to SEQ ID NO: 116. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 117)

ATGGGAAGTGAAAATGTTCACAAAATAATGAAAATCAACATCACT

AAATCATCATTTGTACAACCCTCAAAGCCTACAGTACTACCCACT

AACCACATATGGACTTCTAACTTAGATTTAGTTGTGGGTAGAATT

CATATTTTAACCGTTTACTTTTACCGTCCAAATGGTGCTTCGAAT

TTTTTTGATCCAATTGTTATGAAAAAAGCTTTAGCTGATGTGCTT

GTTTCTTTTTATCCGATGGCCGGAAGAATAAGTAAAGATGATAAT

GGTAGAGTTGTAATTAATTGTAATGATGAAGGTGTTTTGTTTGTT

GAAGCTGAGTCAGATTCCACGTTGGATGACTTCGGTGAGTTTACA

CCGTCTCCGGAGCTCCGACAACTTACCCCGACGATTGATTACTCC

GGTGACATTTCAACGTACCCGCTATTTTTTGCACAGGTAACGCAT

TTCAAGTGTGGAGGAGTTGGTTTTGGTTGTGGTGTGTTTCATACA

CTTGCAGATGGTCTATCCTCTATACATTTCATCAACACATGGTCG

GACATGGCTCGTGGTCTCTCGATAGCCATCCCGCCATTCACTGAC

CGGACCCTTCTTCGTGCACGTGAACCACCCACTCCCACTTTTGAC

CACGTAGAGTACCACCTCCCTCCGTCCATGAAAACTACCTCACAA

ACCAACAAATCCAGAAAGCCTTCCACGGCCATGTTAAAGCTTACG

CTTGATCAACTAAATGCTCTCAAAGCTGCTGCTAAGAATGAAGGC

GGCAACACCAATTATAGCACGTACGAGATCCTGGCGGCTCATTTA

TGGCGGTGTGCCTGCAAGGCTCGAGGACTCCCTGATGACCAACTA

ACCAAATTGTACGTGGCAACAGATGGACGGTCCAGATTGAGCCCT

CAACTCCCACCAGGCTATCTAGGCAATGTTGTGTTCACCGCCACC

CCAGTTGCCAAATCAGCTGACCTCACGACTCAACCATTGTCTAAT

GCAGCATCTTTGATCCGAACCACATTGACAAAAATGGATAACGAC

TATTTGAGATCTGCCATTGATTACCTTGAGGTGCAGCCAGATCTA

TCTGCTTTAATTCGTGGTCCTAGTTACTTTGCTAGCCCGAATTTG

AACATAAACACGTGGACCCGGTTGCCAGTACATGATGCGGATTTC

GGGTGGGGTCGGCCTGTTTTCATGGGACCAGCAGTGATATTGTAT

GAGGGCACCATCTATGTTCTACCAAGCCCAAACAATGATAGGAGT

ATGTCATTGGCAGTCTGTTTAGATGCAGATGAACAACCATCGTTT

GAGAAGTTCCTGTATGACTTTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 87%, at least 90%, at least 93%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 117, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 87% to 100%, 90% to 100%, 93% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 117. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 118)

ATGCCTTCATCATCATCATCGCCTTCTTCAACAGCTGATTCAGTT

ACCATAATCTCAAAATGCACAGTCTACCCACATATGAAAAACTCA

ACACCAGAATCCTTGCAGCTCTCTGTTTCTGATCTCCCAATGCTT

TCATGTCAATACATACAAAAAGGTGTCTTACTTTCTCAACCGCCA

CCCAATCACACCAACAATATCATTTCCCACTTAAAACTCTCTCTC

TCTAAAACCCTCTCTCACTTCCCACCTCTCGCCGGCCGTCTTTCG

ACCGACTCTCACGGCCACGTCTCTATCATCTGCAACGATTCCGGC

GTCGAATTCGTTCACTCCACCGCTAACCACCTCCACACCCACCAA

ATCTTACCCCTCAATTCCGACGTTCACCCATGTTTTAAAACCTTT

TTTGCTTTTGATAAAACTCTGAGTTACGCCGGCCACCACCAACCA

ATCGCCGCCGTGCAAGTCACGGAGCTTGCTGATGGACTCTTTATT

GGGTGTACGGTAAATCATGCTGTCGTTGACGGGACTTCTTTTTGG

AACTTTTTTAATACTTTTGCTGAGATCACAAAAGGGTGTCAGAAA

GTAACGAACTTGCCGGATTTTAGCCGGGAAAATGTTTTCATTTCT

CCGGTTGTTTTGCCTCTTCCCTCCGGCGGCCCGTCGGCGACGTTC

TCAGGTGATGAGCCGTTGAGGGAAAGGATCATTCATTTCAGTAGA

GACGCGATTCTGAAGATGAAATTCAGAGCTAATAATCCTTTATGG

CGGCAACCACAAAATTCGGATCTGGATGATACAGAGATTTACGGG

AAAGTGTGTAACGACATTAACGGCAAAGTTAACGGGGCGTTTAAA

CCCAAAAGTGAAATTTCGTCCTTCCAGTCTTTATGTGGTCAGTTA

TGGCGTGCGGTTACACGCGCGCGTAAATTCAACGACCCTATAAAA

ACGACGACGTTTCGAATGGCGGTGAATTGTAGGCATAGGCTAGAC

CCAAAGGTCGACAAACTTTATTTCGGGAACTTGATCCAAAGCATC

CCGACCGTTGCTTCAGTTGGGGAGTTGTTATCACATGATTTGTCG

TGGGCAGCCAATGAGCTTCACCAAAATGTGGTGGCGCATGATAAT

GCTACCGTGCGCAGGGGTGTTAAGGATTGGGAGAATAATCCAAAG

TTGTTTCCTTTGGGGAATTTTGATGGTGCTATGATCACAATGGGA

AGTTCTCCTAGGTTTCCAATGTATAATAACGATTTCGGGTGGGGC

CGCCCAATGGCGGTTCGTAGTGGTAAAGCTAATAAGTTTGATGGA

AAGATTTCGGCTTTTCCGGGACGTGATGGTGATGGTAGTGTCGAT

CTTGAGGTTGTTTTAGCTCCCGAAACCATGGCATGTCTTGAACGT

GACCATGAATTTATGCAATATGTATCTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 82%, at least 90%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 118, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 82% to 100%, 85% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 118. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 119)

ATGAAGTGGTTTTTCATAACCCATAAAGCAACCCAGCGTTGCCTT

AATTCTAAACAATTTCATCTTCACGGAGGTTCGAATTTCGTTTCC

GGTAATAGATGTTTTCTTGCATCACACTCAATGGAGCGGCCAAAA

TTCATGTTGATACCATATTATCCCTACCAAATTCGGTCCTTAAAT

TCGAGTCACCGATATAGTAGTACGTCACCCAGCGGATCCCCTCAC

AGTTTTCTGAATGGTACTAAGAATGAAAACTATACGAAGAAGGTA

GATCTTGAAATAATTTCAAGAGAAATCATCAAACCAGCTTCTCCA

ACTCCACATCATTTAAGAAACTTCAACTTATCACTTTTGGACCAA

ATAGTATTTGATTGCTACACCCCTGTAATCCTCTTTATTCCAAAT

AGTAATAAGGCTACTGTTACGGATGTCATGATCAAAAGATTGAAA

CATCTCAAGGAGACTTTATCTCGAATTCTAAGTCAATTTTATCCC

TTTGCGGGAGAAGTTAAGGACAGATTGCATATCGAATGCAATGAC

AAGGGAGTCAATTACATCGAGGCTCAAATCAATGAGACATTGGAA

GAATTTCTATGTCATCCAGATAACGAAAAGGCGAGGGAGCTTATG

CCCGAAAGCCCTCATGTTCAAGAATCTGCAATAGGAAACTATGCT

ATGGGTATTCAGATAAACATTTTCAGTTGCGGAGGGATTGGACTT

TCCATGAGCATGGCACACAAGATCATGGACTTCTACACATATACG

ATCTTCATGAAAGCATGGGCTGCAGCTGTTCGAGGTTCACCAGAT

ACAATTATTTCACCAAGTTTTGTGGCTTCTGAGGTCTTTCCTAAT

GATCCCAGCCAAGAAGATTCAATTCCTATCGAGTTAAAGTCTAGT

AATTTGCTTAGCACAAAAAGATTTGAGTTTGATCCTACTGCGTTG

GCTCTCCTAAAGGGACAAGTTGTCGCCAGCGGATCACCTCCCCAA

CGAGGACCAAGTCGTATGGAGGCGACAACAGCCGTTATTTGGAAG

GCCGCTGCAAAAGCTGCATCGACTGTCAGAAGATTCGATCCAAAG

TCACCTCATGCGCTGGCGTTACCAGTAAATATACGTAAAAGGGCA

TCACCTGCTCTCCCAGACAATTCCATAGGAAACATAGTTATGCGA

GGTATAGCAATTTGTTTTCCTGAGAGCCAACCGGACTTGCCAACT

CTTATGGGTAAAGTGAGAGAATCAATAGCGAAACTTAACTCAGAT

TACATTGAGTCCCTGAAAGGTGAAAAGGGGCATGAGACAGTTAAT

AAGATGTTGAAGGAGTTGAAGCTTCGGACGAATATGACAAAGGTA

GGAGGGAAATTCGTTGCTAGTTGCATATTTAATAGTGGAATATAT

GAGTTGGATTTCGGGTGGGGAAAACCGATATGGTTCTATGTTGTG

AATCCAGGAAGCGATAGTTGTGTGGTTTTGACTGATACGCTGAAG

GGTGGTGGTGTTGAAGCCACAATTACACTACCACCAGATGAAATG

GAGATATTCGAACGTGATCATGAGCTTCTATCCTATACTACCATC

AACCCTAGTCCACTGCGATTTCTTGACCATTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 74%, at least 80%, at least 85%, or at least 95% homology or identity to SEQ ID NO: 119, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 74% to 100%, 80% to 100%, 87% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 119. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 120)

ATGGAGGTGCCTGACCAATTCCACCTAAACATTCTTGAACAATGC

CACGTTTCACCATCACCAAATTCCATCATACCTTCATTTTCACTA

CCCTTAACATTCTTAGACATCCCATGGCTTTTTTACCCTTCAAAT

CAAACCCTTTTTTTCTTCCCAGAACCACCACCCAAAACCACCATC

ATCACCACCCTTAAACAATCACTCTCTCTTACCCTCCACCACTTC

CACCCTCTCGCCGGAAACCTCTCACTTCCATCACCTCCGGCGGAA

CCCCACATTGTTTACACCAAAAATGACTCAATTGCACTCACAATT

GCTCAAACAAACACCAACATCCACCATCTTTCTTGCAATCACCCA

AGAAGTGTAAAAAATCTTTACTCTCTTTTACCCAAACTCCCATCT

CCATCCATGTCACGTGAAACTCACGTGGGCCTTGTTATCCCCCTT

CTTACCATCCAAATTACGGTTTTTGCTGATTTGGGGTATTCGATC

GGAGTCACTATGCAACATGCAGCAGTTGATGAACGGACATTTGAT

CAGTTTATGAAATGTTGGGCGTCTGTTTGTACATCTTTGTTGAAA

AATGACTCACTTTTTACATTCAAGTCTACACCTTGGTACGATAGG

AGCGTAATTATCGACCCCAAATCGCTGAAAACAACGTTTTTAAAG

CAATGGTGGAACCGATCTAATTCTCTCAATGAGTCACATGATCAA

GAAAATGATGATCATGATCTTGTTCTAGCAACTTTTGTTTTGAGT

TCATTAGATATTAACATGATCAAGAATCATATTCTTGCAAAATGC

AAGATGATAAATGAGGATCCACCACTACATTTATCTCCTTATGTT

AGTGCATGTGCTTATTTATGGAAATGTTTAATCAAAATTCAAGAA

ACCCATGATTCTATTAAGGGTGGTCCTCTCTATTTAGGGTTTAAT

GCCGGTGGGATTACTCGATTAGGGTACGACATACCTTCAACTTAT

TTTGGGAATTGTATAGCTTTTGGGAGATGCAAGGCATTTGAGAGT

GAATTATTGGGTGATAATGGTATTGTTTTCGCGGCAAAATCGATT

GGAAAAGAGATCAAGAGGCTTGATAAGGATGTTTTAGGAGGTGCT

AATAAGTGGATTAGTGATTGGGATGAATTAACCATTAGGCTTCTT

GGTTCACCAAAAGTTGATTCATATGGTATGGATTTTGGATGGGGT

AAAGTTGAGAAGGTTGAAAAAATATCAAGTATTTCAAATCACGGT

AGGGTTAATGTAATTTCTTTGAGTGGATGTAAGGATTTTAAAGGT

GGAATAGAGATAGGGGTTGTTCTTTCTGTGGCTAAAATGAATGTT

TTCACTTCCCTCTTTCATGGAGGTTTAATGGAGTTTGCATATTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 79%, at least 87%, at least 93%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 120, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 79% to 100%, 85% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 120. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 121)

ATGAAAAATAAGAACCCGACTAGTGTGATCAGAGAGGCTTTAGCT

AAGGTATTGGTGTTTTATTATCCGTTTGCTGGCCGGCTCAAGGAA

GGGCCGGCCAGGAAACTGATGGTGGATTGTTCTGGTGAAGGTGTG

TTGTTTATTGAGGCAGAAGCTGATGTCACGTTGAAACAATTTGGT

GACGCACTTCAACCGCCATTTCCTTGTTTAGAAGAGCTTCTTTAC

GATGTTCCTGGATCTACTGGTATTCTAGATACACCATTATTGCTG

ATTCAGGTGACACGATTGTTATGTGGAGGTTTTATCTTTGCTCTA

CGACTCAACCACACCATGAGCGACGCAGCAGGTCTCGTTCAATTC

ATGACAGGGCTTGGTGAAATGGCACAAGGTGCATCAAGGCCATCA

ACGTTGCCTGTATGGCAAAGGGAGTTGCTTTTTGCAAGGGACCCA

CCACGCGTGACTTGTACTCATCACGAGTATACTGAAGTGGAAGAC

ACCAATGGTACAATCATTCCGCTAGATGACATGGCACATAAATCA

TTTTTCTTTGGACCTTCTGAGATATCAGCGTTGCGAAGGTTCGTT

CCATCATACCTAAAAAAGTGTTCTACTTTTGAGGTCTTAACCGCT

TGCCTATGGCGTTGTCGTACAATTGCACTCCAGCCAGATCCCGAA

GAAGAGATGCGCATGATATGCATTGTTAATGCGCGTGGAAAGTTT

AATCCTCCCCTATTACCCAAAGGATATTATGGAAATGGTTTCGCT

ATACCAGTGGCCATTTCAACAGCTGGAGACCTATCTAGCAAACCA

TTAGGTCACGCATTGGAACTTGTAATGAAAGCCAAATCCAATGTC

ACTGAGGAGTATATGAGATCAGTAGCCGACTTAATGGTAATCAAG

GGACGACCCCACTATACGGTTGTCCGAAGCTACCTTGTATCGGAT

GTGACTCACGCTGGATTTGATGTTGTTGATTTCGGGTGGGGGAAA

GCGTCCTATGGAGGACCTGCAAAAGGGGGAGTAGGTGCTATTCCC

GGAGTTGTTACTTTCTTTATACCTTTTACAAACCATAAAGGCGAG

TCTGGAATTGTGCTACCTATATGTTTGCCGAGTGCAGCCATGGAT

AAGTTTGTTGAAGAGTTAAATAAGATGTTGGTCCCAGACAACAAC

GAACAAGTACTCCGAGAACACAAGTTACTAGTTCTCGCTAGATTG

TAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 82, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 121, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 82% to 100%, 85% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 121. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 122)

ATGGCACAAATCGACACTCCATTGACATTCAAAGTCCGGAGACAT

GCACCGGAGCTGATCGCTCCAGCGAAACCTACGCCACGAGAACTA

AAACCTCTATCCGACATTGATGATCAAGAAGGCCTTAGGTTTCAT

ATCCCAGTGATTCAATTCTATCGTAGCGATCCAAAGATGAAAAAT

AAGAACCCGGCTAGTGTGATCAGAGAGGCTTTAGCTAAGGTGTTG

GTGTTTTACTATCCGTTTGCTGGCCGGCTCAAGGAAGGGCCTGCC

AGGAAACTGATGGTAGATTGCTCTGGTGAAGGTGTGTTGTTTATT

GAGGCGGAAGCTGATGTCACGTTGAAACAATTTGGTGACGCCCTT

CAACCGCCGTTTCCTTGTTTGGAAGAGCTTCTTTACGATGTTCCT

GGATCTACTGGCGTTCTAGATACACCGTTATTGCTGATTCAGGTG

ACACGATTGTTATGTGGAGGTTTTATCTTTGCTCTACGACTCAAT

CACACCATGAGCGACGCACCAGGTCTCGTTCAATTCATGACAGGG

CTCGGTGAAATGGCACAAGGTGCATCAAGGCCATCTACGTTGCCT

GTATGGCAAAGGGAGTTGCTTTTAGCAAGGGACCCACCACGCGTG

ACATGTACTCATCACGAGTATACTGAAGTGGAAGACACCAAGGGT

ACAATCATTCCGCTAGATGACATGGCACATAAATCATTTTTCTTT

GGACCTTCTGAGATATCAGCATTGCGAAGGTTCGTTCCATCATAC

CTAAAAAAGTGTTCTACTTTTGAGGTCTTAACCGCTTGCCTATGG

CGTTGTCGTACAATTGCACTCCAGCCAGATCCCGAAGAAGAGATG

CGCATAATATGCATTGTTAATGCGCGCGGAAAGTTTAATCCACCC

CTTCCTAAAGGTTATTATGGAAATGGTTTTGCTTTCCCAGTGGCC

ATTTCAACAGCTGGAGATCTATCCAGCAAACCATTAGGTCATGCA

TTGGAACTTGTAATGAAAGCCAAATCCGATGTCACTGAGGAGTAT

ATGAGATCAATAGCCGACTTAATGGTAATCAAGGGACGTCCCCAC

TTTACGGTTGTCAGAAGCTACCTTGTCTCGGATGTGACTCACGCT

GGATTTGATGTTGTTGATTTCGGGTGGGGGAAAGCGGCCTATGGA

GGACCCGCTAAAGGGGGAGTAGGTGCTATCCCAGGTGTTGCTAGT

TTCTATATACCTTTTACAAACCATAAAGGCGAGTCTGGAATTGTG

CTACCTATATGTTTGCCGAGTGCGGCCATGGATAAGTTTGTTGAA

GAGTTAAATAAGATGTTGGTCCCAGACAACAACGAACAAGTACTC

CGAGAACACAAGTTACTAGTTCTTGCTAGATTGTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 83%, at least 85%, at least 89%, at least 92%, at least 95%, at least 97%, or at least 99% homology or identity to SEQ ID NO: 122, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 83% to 100%, 88% to 100%, 92% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 122. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 123)

ATGGAAATACAAGTAATAAACTACTCATCAAAGCTAGTAAAACCC

TTGACACCAACACCCACCGCAAATCGTTACTATAACATTTCTTTC

ACCGATGAGCTCGTCCCAACCATTTACGTCCCACTCATTCTCTAC

TACGCAACACCGAAAAACCCAAATGGTGATCACTTTGAAAACATT

TGTGACCGTCTGGAGGAGTCGTTATCGAAAACGTTAAGTGATTTT

TACCCACTGGCCGCGAGATTCATTCGTAAACTCTCCTTAATTGAT

TGTAACGATCAAGGGGTTTTGTTTGTCCTAGGCAATGTAAATATC

CGACTTTCGGATGTTACAGGCCTAGGACTGACGTTTAAAACCAGT

GTTTTAAATGATTTTCTCCCGTGTGAGATTGGAGGAGCGGATGAA

GTCGATGATCCTATGCTTTGTGTCAAAGTCACCACTTTTGAGTGT

GGTGGTTTTGCAATTGGTATGTGTTTTTCGCATAGGCTTTCGGAT

ATGGGTACCATGTGTAACTTTATTAACAATTGGGCTGCTAGAACT

ATTGGTGAATATGATAATGAAAAACATACTCCTATTTTTAATTCG

CCGTTGTACTTCCCGCAACGAGGATTACCTGAACTTGACCTAAAA

GTACCTAGGTCAAGTATTGGTGTGAAAAATGCAGCACGCATGTTT

CACTTTAATGGGAAGGCAATATCATCCATGAGAGAAGTTTTTGGA

GTTGATGAAAATGGGTCTCGTAGACTCTCAAAGGTTCAACTTGTT

GTAGCCTTGTTGTGGAAGGCCTTTGTTCGCATAGATGATGTGAAC

GATGGCCAATCTAAGGCGTCTTTTCTGATCCAACCAGTTGGGTTG

AGGGACAAAGTTGTCCCTCCATTACCATCAAACTCATTTGGGAAT

TTTTGGGGTCTAGCGACTTCCCAACTTGGTCCTGGTGAGGGTCAC

AAAATCGGTTTCCAAGAATATTTTTACATTTTGCGTGAATCTATT

AAGAAAAGAGCTAGGGATTGCGCTAAAATATTGACACACGGTGAA

GAAGGATATGGGGTTGTAATCGATCCATATCTTGAGTCGAATCAA

AAGATAGCTGATAATGGTACAAACTTTTACTTGTTCACTTGTTGG

TGCAAGTTTTCGTTCTACGAAGCTGATTTTGGTTGTGGTAAGCCG

ATTTGGGCTAGCACCGGAAAGTTTCCGGTTCAAAATTTGGTGATC

ATGATGGATGATAATGAGGGTGATGGTGTAGAAGCGTGGGTTCAT

TTAGACGATAAACGCATGAATGAGTTAGAACAAGATCCTGATGTT

AAACTCTACGCATGCAATTTAGCTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 77, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 123, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 77% to 100%, 82% to 100%, 87% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 123. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 124)

ATGAAATTAGCAGTGAAGGAATCAGTGATAGTAAAACCATCCAAA

ACGACACCGTGTCAGCAAATATGGACATCAAATCTTGATTTAGTG

GTGGGTCGGATCCATATATTAACCGTTTACCTTTACAGACCAAAT

GGGTCTTCAAATTTCTTTGATTCCATGGTTTTAAAGAAGGCTCTA

GCCGACGTTTTAGTTTCTTTTTTTCCGGTGGCCGGACGGTTGGAT

AAAGACGGTGACGGCAGAGTTGTAATAGATTGTAACGGTGAGGGT

GTTTTGTTTGTGGAAGCTGAAGCTGATTGTTGCATTGATGATTTT

GGTGAGATTACTCCGTCGCCGGAGTTACGACGGTTGGTGCCGACG

GTGGATTATTCCGGTGATATGTCTTCTTATCCGTTATTTATTACG

CAGGTTACACGGTTCAAGTGTGGGGGAGTTTCGTTAGGCTGTGGA

CTACACCATACGTTATCGGATGGACTCTCAGCACTTCACTTCATC

AACACATGGTCTGATGTAGCTAGAGGCCTATCGGTGGCAATCCCA

CCGTTCATTGACCGCTCCCTTCTTCGAGCTCGTGATCCACCATCC

CCTGTGTTTGACCACATCGAATACCACCCACCACCGTCACTGATC

ACTCCGTTGCAAAACCAAAAGAACGCGTCACATTCGAGGTCTGCT

TCAACTTTAATCCTACGGCTCACACTCCATCAAATAAACAATCTT

AAATCAAAGGCTAAAGGCGATGGGAGCATGTACCATAGCACGTAC

GAGATCCTAGCTGCTCATCTATGGCGATGTGCGTGCAAAGCACGT

GGACTAGCAAACGATCAACCAACCAAATTGTATGTGGCCACCGAT

GGACGGTCAAGATTGATTCCTCCACTCCCTCCGGGCTACCTTGGG

AATGTCGTTTTCACGGCTACTCCTGTCGCTAAATCGGGAGATTTC

GAATCTGAATCCTTGGCAGAGACAGCAAGGAGGATTCGCAGTGAG

TTGGGTAAAATGAACGATGAGTATCTTAGATCAGCTATTGACTAC

TTAGAGTCGGTATCTGATATTTCGACCCTTGTTAGAGGGCCGACT

TACTTTGCGAGTCCAAATCTGAATGTAAACAGTTGGACTCGGTTA

CCAATATACGAATCTGACTTCGGTTGGGGTCGACCTATTTTCATG

GGACCCGCAAGTATACTTTACGAGGGTACGATTTACATCATACCG

AGCCCTAGTGGTGATCGGAGTGTGTCTCTGGCCGTGTGCTTGGAC

CCTGATCACATGGCTTTGTTTAAAGAATGCTTGTACGTTTTTTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 84, at least 89%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 124, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 84% to 100%, 88% to 100%, 93% to 100%, or 97% to 100% homology or identity to SEQ ID NO: 124. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 125)

ATGAAGCTAGCAGTGAAGGAATCAGTGATAGTAAAACCATCCAAA

ACGACACCGTGTCAGCAAATACGGACATCAAATCTTGATTTAGTG

GCGGGTCGGATCCATATATTAGTCGTTTTCTTTTACAGACCAAAT

GGGTCTTCGAATTTCTTTGATTCCTTGGTTTTAAAGAAGGCTCTC

GCCGACGTTTTAGTTCCTTTTTTTCCGGTGGCCGGACGGTTCAGT

GAAGACGGTGACGGCAGAGTTGTAATTGATTGTAACGGTGAGGGT

GTTTTGTTTGTGGAATCTGAAGCTGATTGTTGCATTGATGATTTT

GGTGAGATTACTCTGTCGCCGGAGTTACAACAGTTGGTGCCGACG

GTGGATTATTCCGGTGATATGTCTTCTTATCCGTTATTTATTGCG

CAGGTCACACGGTTCAAGTGTGGGGGAGTTTCGTTAGGTTGGGGA

CTACACCATACATTATTGGATGGACTCTCAGCACTTCACTTCGTC

AACACATGGGGTGATGTAGCTAGAGGCCTATCGGTGGCAATCCAA

CCGTTCATTGACCGCTCCCTTCTTCGAGCTCGTGATCCACCGACC

CCTGTGTTTGACCACATCGAATACCACCCACCACCGTCACTGATC

ACTCCATTGCAAAACCAAAAGAACGCATCACATTCGAGGTCTGCT

TCAACTTTAATCCTACAGCTCACACCCGATCAAATAAAGAATCTT

AAATCAAAGGCTAAAGGCGATGGGAGCATGTACCATAGCACATAC

GAGATCCTAGCTGCTCATCTATGGCGATGTGCGTGCAAAGCGCGT

GGACTAGCAAACGATCAACCAACCAAATTGTATGTGGCCGCCAAT

GGACGGTCAAGATTGATTCCTCCACTCCCTCCGGGCTACCTTGGG

AATGTCGTTTTCAACGCTACTCATGTCGCTAAATCGGGGGATTTT

GAATCTGAATCCTTGGCAGAGACTGCAAGGAGGATTCACTGTGAG

TTGGGTAAAATGAACGATGAGTATTTTAGATCAGCTATCGACTAC

TTAGAGTCGGTAGATGATATTTCAACCCTTGTCAAAGGGCCGACT

TACTTTGCGAGTCCAAATCTGAATGTATACAGTTGGATTGGGATA

CCAATATATGCATGTGACTTCGGATGGGGTCAACCTATTTTCATG

AGACCCGCAAGTTTCCTTTACGATGGTTCCATTTACATCATACCG

AGCCCTAGTGGTGATCGGAGTGTGTTGTTGGCCGTGTGCTTGGAC

CCTGATCACATGGATTTGTTTAAAGAATGCTTGTACGCTTTTTAG.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 82, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 125, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 82% to 100%, 85% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 125. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 126)

ATGGTGATGATTAGCAAGCTTTTACGATTAGGTAGAAGAAAACTT

CACACAATTGTATCAAGAGATACCATTAGACCTTCTTCTCCAACT

CCCTCTCATTCCAAAACATATAATCTCTCCTTGCTCGATCAAATA

GCTGTAAATTCATACGTGCCGATTGTTGCTTTTTACCCAAGCTCA

AATGTTTGTCGAAGTTCCGATGATAAGACGCTGGAGTTGAAGAAC

TCATTATCGAAAATATTAACTCATTACTATCCGTTTGCCGGTAGA

ATGAAGAAGAATCGCCCTACCGTCGTTGATTGCAATGATGAAGGG

GTTGAGTTCGTTGAAGCACGTAATACCAACTCGTTATCAGATTTC

CTCCAACAATCGGAGCACGAAGATCTAGATCAACTCTTTCCAGAT

GATTGTGTATGGTTCAAACAAAACCTTAAAGGTTCTATTAATGAC

GCAAATAATAGTAGCGTATGTCCATTGAGCATTCAAGTCAACCAT

TTCGCGTGTGGAGGTGTAGCAGTTGCAACTTCGTTACGCCACAAG

ATTGGAGACGGAAGCAGTGCGTTAAATTTCATTAAACACTGGGCT

GCAGTTACGTCACACTCTCGAGCAGGGAATCATCAAATTGATGCG

ACATCACCCATCATTAATCCCCATTTCATTTCTTACCCAACTAGA

ACTTTTAAATTGCCAGATAGGTCACCATACATACCACCTAGTGAT

GTTGTGTCAAAAAGTTTTGTTTTCCCCAACACAAATATAAAGGAC

CTCCAAGCCAAGGTGGTAACCATGACCATGGGCTCTAGACAACCT

ATCGTGAACCCTACCCGAGCTGATGTCGTATCATGGCTTCTACAT

AAGTGTGTAGTAGCAGCAGCTACCAAAAGGATATCGGGAAATTTT

AAAGAAAGTTGCGTGATCTCGCCATTAAATCTGAGAAACAAGTTA

GAAGAGCCATTGCCTGAAACAAGCATAGGAAATATTTTCTATCTG

ATAACCTTTCCAATAAGCAATAATCATGGCGATCTCATGCCCGAT

GACTTCATTAGCCAACTCAGGCTAGGAATACGTAAGTTTCAAAAT

ATACGAAATTTGGAAACTGCATTACGAACCGTTGAAGAGATGATA

TCTGAAACTTTTATCTTGGGTACGGCAGAAAGCATGGATACTAGT

TATGTATATTCGAGCATCCGTGGGTTTCCGATGTATGATATTGAT

TTTGGGTGGGGGAAGCCCGTAAAAGTAACCGTTGGGGGAGCCCTT

AAGAACTTAAGTATTCTGATGGACACTCCTGATGTCAATGGCATC

GAAGCACTAGTGTCTTTGGATAAACAAGACATGAAGATACTTCTA

AACGACCCTGAGTTGTTGGCCTTTTGCTTGTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 72, at least 80%, at least 85%, at least 87%, at least 93%, or at least 99% homology or identity to SEQ ID NO: 126, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 72% to 100%, 79% to 100%, 86% to 100%, or 91% to 100% homology or identity to SEQ ID NO: 126. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 127)

ATGAGTACTAGTGACAAAATGAAGATAACAATAAGAGAATCATCAATGAT

AAAACCATCCAAACCGACGCCGGATCAACGGATATGGAACTCAAATCTTG

ATTTGGTAGTGGGTCGGATCCATATCTTGACCCTTTACTTTTTTAGGCCA

AATGGGTCTTCGGATTTCTTTGATTCTGAGGTTTTAAAGCAATCACTTGC

CGACGTTCTTGTTTCTTTTTTTCCGATGGCCGGACGATTGGGATTAGACG

GCGATGGCAGAGTTGAAATTAATTGCAACGGTGAAGGTGTTTTGTTTGTT

GAAGCTGAAGCGGATTGTAGTATTGATGATTTTGGTGAGATTACTCCGTC

GCCGGAGCTACGGCGGTTGGCGCCAACAGTGGATTATTCCGGCGATATCT

CATCTTATCCACTCGTTATTACCCAGGTAACACATTTCAAATGTGGTGGA

GTTTCTCTTGGGTGTGGACTACACCATACATTATCCGATGGACTTTCATC

TCTTCACTTCATCAACACATGGTCCGATGTTACCCGAGGCTTACCCGTTG

CGATCCCGCCATTCGTAGATCGTACGGTTCTTCGTGCTAGGGACCCGCCA

ACCGTGGTCTTTGATCACGTGGAATACCACACTCCTCCTTCCATGACCTC

AAGTTTGGACAAAGACAAACCTCAATCCGAAGATGTTCATGTTTCCACTT

CCATGCTACGGCTCACACTCGATCAAATAAATGCACTAAAAGCAAAAGGC

AAAGGTGACGGAATTGTGTACCATAGCACATATGAAATCCTAGCTGCTCA

TTTATGGCGATGTGCGTGTAAAGCACGTGGGCTCCTGAATGATCAAATGA

CTAAATTGTATGTAGCTACCGATGGACGGTCCAGATTGATTCCCCCACTC

CCACCGGGGTACTTAGGCAATGTGGTCTTCACCGCCACACCAATTGCCAA

ATCCGGCGAGCTCCAACAGGAACCACTAGCTACCACTGCAAGAAAAATTC

ATACAGAGTTGGCCAAAATGGATGACAAGTACCTCAGGTCGGCCCTCGAC

TACTTAGAGTCACAACAGGACTTGTCAGCACTAATTCGAGGGCCAGCCTA

TTTTGCGTGCCCTAACCTCAACATCAATAGTTGGACTCGCCTTCCAATAT

ATGATGCGGACTTTGGGTGGGGTCGGCCCATATTTATGGGACCCGCCAGC

ATACTTTACGAGGGCACGATTTACATTATTCCGAGCCCTAGTGGTGACCG

AAGTGTGTCGTTGGCTGTGTGCTTAGACCCCTCTCATATGCCTCTCTTCC

AAAAGTACTTGTATGAACTTTAA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 79, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 127, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 79% to 100%, 85% to 100%, 90% to 100%, or 95% to 100% homology or identity to SEQ ID NO: 127. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid sequence:

(SEQ ID NO: 128)

ATGGTGAATGTTGAGATCATTTCTAATGAATACATAAAACCATCCTCCCC

AACACCACCACATCTTAAAATATACAATCTTTCCATCTTAGATCAACTCA

TTCCTGCCCCCTATGCACCTATCATACTATATTATCCGAATCAAGATCAC

ATTAACGATTTTGAGGTTCACGAACGGTTGAAACTACTAAAAGATTCGTT

ATCGAAAACGCTAACTCGTTTTTACCCATTAGCCGGAACCATCAAAGGCG

ATCTTTCCATTGATTGTAACGATATTGGTGCTTACTTTGCAGTAGCTCAT

GTAAATACTCGCCTTGATGTGTTCCTGAACCATCCTGATCTTGACCTAAT

AAACTGTTTTCTTCCACGTGGGCCTTACTTGAATGGTTCTAGTGAAGGAA

GTTGTGTGAGTAATGTTCAAGTGAACATTTTTGAGTGTTGTGGGATTGCA

ATTAGTTTATGCATTTCTCACAAGATTCTTGATGGTGCTGCGTTGAGTAC

TTTTCTTAAAGCATGGGCAGGGACAAGTTACGGGTCGAAAGAAGTAGTGT

ATCCAAACATGAGTGCACCATCTTTATTTCCTGCTAAAGATTTGTGGCTT

AAAGATTCATCAATGGTCATGTTTGGGTCTTTGTTTAAGATGGGTAAGTG

TAGTACTAAAAGATTTGTTTTTGATTCATCAAAATTATCCTTCCTCAAAG

CTAAGGCATCGCTAAATGGGCTAAAAGACCCAACCCGCGTAGAGGTGGTG

TCTGCTTTACTATGGAAGTGTATCATGGCTGCATCTGAAGAAAACACTGG

TTCTTGGAAGCCATCTCTGTTAAGCCATGTAGTTAACCTTCGCAAAAGGT

TGGTTTCAACTTTATCAGAAGACTCAATTGGGAACTTAATTTGGTTAGCA

AGCGCAGAATGTAGAACCAACGCTCAATCCCGATTGAGTGATCTTGTTGA

AAAGGTACGTGATAGTGTGTCGAAAATCAATAGTGAGTTTGTGAAGAAAA

TACAAGGCGATAAAGGGACAAAAGTGATGGAAGAGTCTCTCAAGAGTATG

AAAGATTGTGCGGATTATATCGGGTTTACGAGTTGGTGTAAGATGGGGTT

TTACGATGTGGATTTTGGTTGGGGAAAGCCTGTATGGGTTTGTGGTAGCG

TTTGTGAAGGTAGCCCGGTGTTCATGAATTTTGTCATATTAATGGACACA

AAATATGGTGATGGAATAGAAGCATGGGTGAGCTTGGATGAACACGAAAT

GCATATCTTAAAGCATAATCCCGAGCTCTTGGAATATGCATCAATCGATC

CAAGTCCTCTGCAAATGAATAAGTGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 82, at least 85%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 128, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 82% to 100%, 88% to 100%, 93% to 100%, or 97% to 100% homology or identity to SEQ ID NO: 128. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises or consists of the nucleic acid

(SEQ ID NO: 129)

ATGGGAACTATTTATCAATCTCCCATGATCAAATCTTCTACTCCCAAAAT

AATTGAAGACCTCAAAGTTATCATCCATGACACATTCACAATCTTCCCAC

CTCACGAAACCGAAAAGCGGTCCATGTTCTTATCGAACATTGACCAAGTT

CTTACTTTCAACGTTGAAACGGTCCATTTTTTTGCAGCCAACCCTGACTT

TCCGCCACAAGTAGTGGCGGAAAAGCTCAAGTTGGCTCTAAGTAAGGCGC

TGGTGCCATATGATTTTTTGGCAGGGAGGTTGAAGTTGAACCATGAGTCG

CAACGGTTTGAGTTTGATTGTAATGGTGCTGGGGCTCGGTTCGTGGTGGG

TTCGAGTGAGTTTGAGTTGGGTGAGATTGGTGACTTGGTGTATCCAAACC

CTGGGTTTAGACAATTGGTTCAAAAGAGTTATGATAACTTGGAGTTACAT

GAAAAGCCACTATGCATTTTACAGCTGACATCCTTCAAGTGTGGAGGATT

TGCACTTGGTGTAGCAACAAATCATGCCACTTTTGATGGCTTAAGTTTCA

AAACATTTCTTCAAAATCTTGGTTCTTTGGCTGCTGATCAACCACTTGCC

GTCGATCCCTGCAACGATCGCCACCTATTGGCAGCACGATCACCACCAAA

AGTCCAATTTGACCACCCTGAACTCCTCAAAATCCCAACAGGAACAGACA

TCCCAAACCCAACAGTCTTTGACTGCCCAGAAAGTCAACTTGACTTCAAG

ATTTTCAACTTGACCTCAGATGACATAGCCCACTTAAAAACGAAAGCCAA

AGATGGGCCTGGGTCAACCAATGCAAAAATCACTGGATTCAATGTGGTTG

CAGCCCATGTATGGCGGTGCAAAGCGTTGTCCTCAGGGTCAGAATATGAC

CCCGAGAGAGTGTCAACCGTGTTATATGCTGTTGACATTCGGTCAAGATT

GAACTTACCATTATCATTAGCTGGCAATGCAGTTCTTAGTGCATACGCCT

CGGCCAAATGCAAAGAGATTGAAGAAGGCCCGTTGTCAAGACTAGTGGAA

ATGGTGACCGAAGGTACTAACAGAATGACTGGTGAGTATGCAAGATCGGT

GATCGATTGGGGAGAGGTGAATAAAGGGTTTCCAAATGGGGAGTTTCTGA

TATCGTCATGGTGGCGATTGGGGTTTGCTGACGTGGAATATCCGTGGGGT

AAACCTAGGTATAGTTGTCCCGTGGTTTATCATAGGAAAGATATAATATT

ACTCTTTCCGGATATTGTTGGTGCCGATAACAACAATGAAGTGAATGTGT

TGGTGGCTTTGCCTGGCAAAGAAATGGAGAAATTTGAGACTTTATTTCAT

AAGTTTTTGGCATGA.

In some embodiments, the DNA molecule comprises a nucleic acid sequence with at least 87, at least 91%, at least 95%, or at least 99% homology or identity to SEQ ID NO: 129, or any value and range therebetween. Each possibility represents a separate embodiment of the invention. In some embodiments, the DNA molecule comprises a nucleic acid sequence with 87% to 100%, 90% to 100%, 94% to 100%, or 97% to 100% homology or identity to SEQ ID NO: 129. Each possibility represents a separate embodiment of the invention.

In some embodiments, the DNA molecule comprises a plurality of nucleic acid sequences. In some embodiments, the polynucleotide comprises a plurality of types of polynucleotides.

As used herein, the term “plurality” comprises any integer equal to or greater than 2.

In some embodiments, plurality of nucleic acid sequences encode proteins of different enzymatic functions or families as described herein. In some embodiments, plurality of nucleic acid sequences encode at least two proteins of the same enzymatic function or family as described herein. In some embodiments, plurality of nucleic acid sequences encode a plurality of proteins of a plurality of different enzymatic functions or families as described herein.

In some embodiments, the DNA molecule encodes a protein characterized by acyl activating enzymatic (AAE) activity. In some embodiments, the DNA molecule encodes an AAE protein. In some embodiments, the AAE is an AAE derived from Helichrysum umbraculigerum. In some embodiments, the DNA molecule encoding a protein characterized by acyl activating enzymatic (AAE) activity comprises a nucleic acid sequence set forth in SEQ ID Nos.: 1-11.

As used herein, the terms “acyl activating enzyme” and “AAE” are interchangeable, and refer to any peptide, polypeptide, or a protein, capable of catalyzing the activation of a carboxylic acid. In some embodiments, AAE activity comprises forming or formation of a thioester bond. In some embodiments, AAE activity comprises coupling a carboxyl group to an amine group. In some embodiments, AAE activity comprises coupling a carboxyl group to an alcohol. In some embodiments, the AAE is an acid-thiol ligase.

In some embodiments, the DNA molecule encodes a protein characterized by polyketide synthesizing activity. In some embodiments, the DNA molecule encodes a protein being a polyketide synthase (PKS). In some embodiments, the PKS is a PKS derived from Helichrysum umbraculigerum. As used herein, the terms “polyketide synthase” and “PKS” encompasses any enzyme derived from H. umbraculigerum and having or characterized by being functional analog of the “olivetol synthase” or “OLS” of Cannabis sativa. In some embodiments, the DNA molecule encoding a protein characterized by polyketide synthesizing activity comprises a nucleic acid sequence set forth in SEQ ID Nos.: 23-26.

As used herein, the terms “polyketide synthase” and “PKS” are interchangeable, and refer to any peptide, polypeptide, or a protein, capable of catalyzing the elongation of a ketide or a polyketide chain. In some embodiments, PKS activity transacylation. In some embodiments, PKS activity comprises Claisen condensation. In some embodiments, PKS activity comprises reduction of β-keto group to a β-hydroxy group. In some embodiments, PKS activity comprises H₂O splitting, thereby obtaining, providing, or resulting in a α-β-unsaturated alkene. In some embodiments, PKS activity comprises reducing a α-β-double-bond to a single-bond. In some embodiments, PKS activity comprises hydrolyzing a polyketide chain or a completed polyketide chain from an acyl carrier protein domain of the PKS. In some embodiments, PKS activity comprises polymerizing and/or ligating a diketide substrate into a polyketide chain. In some embodiments, PKS activity comprises elongating a diketide to a polyketide chain. In some embodiments, PKS activity comprises elongating a polyketide chain.

In some embodiments, the DNA molecule encodes a protein characterized by polyketide cyclizing activity. In some embodiments, the DNA molecule encodes a protein being a polyketide cyclase (PKC). In some embodiments, the PKC is a PKC derived from Helichrysum umbraculigerum. As used herein, the terms “polyketide cyclase” and “PKC” encompasses any enzyme derived from H. umbraculigerum and having or characterized by being functional analog of the “olivetolic acid cyclase” or “OAC” of Cannabis sativa. In some embodiments, the DNA molecule encoding a protein characterized by polyketide cyclizing activity comprises a nucleic acid sequence set forth in SEQ ID Nos.: 31-38.

As used herein, the terms “polyketide cyclase” and “PKC” are interchangeable, and refer to any peptide, polypeptide, or a protein, capable of folding and/or cyclizing a polyketide. In some embodiments, PKC activity comprises an action of a cyclase subunit. In some embodiments, PKC activity comprises site-specific keto-reductase activity.

In some embodiments, the DNA molecule encodes a protein characterized by prenyl transferring activity. In some embodiments, the DNA molecule encodes a protein being a prenyltransferase (PT). In some embodiments, the PT is a PT derived from Helichrysum umbraculigerum. As used herein, the terms “prenyltransferase” and “PT” encompass any enzyme derived from H. umbraculigerum and having or characterized by being functional analog of the “geranylpyrophosphate: olivetolate geranyltransferase” or “GOT” of Cannabis sativa. In some embodiments, the GOT is GOT4 or CsGOT4. In some embodiments, the DNA molecule encoding a protein characterized by prenyl transferring activity comprises a nucleic acid sequence set forth in SEQ ID Nos.: 47-58.

As used herein, the terms “prenyltransferase” and “PT” are interchangeable, and refer to any peptide, polypeptide, or a protein, capable of transferring an allylic prenyl group to an acceptor molecule. In some embodiments, PT activity comprises cyclization. In some embodiments, PT activity comprises transferring an allylic prenyl group to an acceptor molecule.

In some embodiments, the DNA molecule encodes a protein characterized by cannabigerolic acid (CBGA) cyclization or cyclizing activity. In some embodiments, cycling activity comprises cyclization of CBGA to CBCA. In some embodiments, the polynucleotide encodes a protein capable of cyclizing or cyclization of CBGA to CBCA. In some embodiments, the DNA molecule encodes a protein characterized by being capable of synthesizing CBCA or being a CBCA synthase (CBCAS). In some embodiments, the CBCAS is a CBCAS derived from Helichrysum umbraculigerum. As used herein, the terms “CBCA synthase” and “CBCSA” encompass any enzyme derived from H. umbraculigerum and having or characterized by being a functional analog of the CBCA synthase of Cannabis sativa (e.g., CsCBCAS). In some embodiments, the DNA molecule encoding a protein characterized by CBGA cyclization or cyclizing activity comprises a nucleic acid sequence set forth in SEQ ID Nos.: 71-79.

In some embodiments, the polynucleotide encodes a protein characterized by catalytic activity of transfer a glucuronic acid component of UDP-glucuronic acid to a small hydrophobic molecule (e.g., a UGT). In some embodiments, the polynucleotide encodes a protein characterized by glycosyltransferase catalytic activity. In some embodiments, the polynucleotide encodes a protein characterized by being capable of transferring glucuronic acid component of UDP-glucuronic acid to a cannabinoid or a precursor thereof. In some embodiments, the polynucleotide encodes a protein characterized by having a catalytic activity of glycosylating a cannabinoid or a precursor thereof. In some embodiments, the polynucleotide encodes a UGT enzyme.

In some embodiments, the UGT is a UGT derived from Helichrysum umbraculigerum. As used herein, the term “UGT” encompass any enzyme derived from H. umbraculigerum and having or characterized by having an activity as described herein.

In some embodiments, the UGT protein is encoded by a DNA molecule comprising SEQ ID Nos.: 89-101.

In some embodiments, the DNA molecule encodes a protein characterized by being capable of acting on an acyl group. In some embodiments, the DNA molecule encodes a protein characterized by catalytic activity of transferring an acyl group from a donor molecule to an acceptor molecule. In some embodiments, the acceptor molecule is a hydrophobic molecule, a small molecule, or both. In some embodiments, the donor molecule comprises an acyl group, CoA, or both. In some embodiments, the DNA molecule encodes a protein characterized by acyltransferase catalytic activity. In some embodiments, the DNA molecule encodes a protein characterized by being capable of transferring an acyl group to a cannabinoid. In some embodiments, the DNA molecule encodes a protein characterized by having a catalytic activity of acylating a cannabinoid. In some embodiments, the acyltransferase (AT) is an alcohol acyltransferase (AAT). In some embodiments, the DNA molecule encodes an AT enzyme. In some embodiments, the polynucleotide encodes an AAT enzyme.

In some embodiments, the AAT is an AAT derived from Helichrysum umbraculigerum. As used herein, the term “AAT” encompass any enzyme derived from H. umbraculigerum and having or characterized by having an activity as described herein.

In some embodiments, the AAT protein is encoded by a DNA molecule comprising or consisting of SEQ ID Nos.: 115-129.

In some embodiments, the artificial vector comprises a plasmid. In some embodiments, the artificial vector comprises or is an agrobacterium comprising the artificial nucleic acid molecule. In some embodiments, the artificial vector is an expression vector. In some embodiments, the artificial vector is a plant expression vector. In some embodiments, the artificial vector is for use in expressing any one of: AAE, PKS, PKC, PT, or CBCAS encoding nucleic acid sequence as disclosed herein, or any combination thereof. In some embodiments, the artificial vector is further for the use in expressing UGT, AAT, or both. In some embodiments, the artificial vector is for use in heterologous expression of any one of: AAE, PKS, PKC, PT, or CBCAS encoding nucleic acid sequence as disclosed herein, or any combination thereof, in a cell, a tissue, or an organism. In some embodiments, the artificial vector is further for the use in heterologous expression of UGT, AAT, or both in a cell, in a tissue, or an organism. In some embodiments, the artificial vector is for use in producing or the production of an acyl-coenzyme A (acyl-CoA), a polyketide, a cannabinoid, e.g., CBGA, CBCA, any precursor thereof, or any combination thereof, in a cell, a tissue, or an organism. In some embodiments, the artificial vector is further used in producing or the production of a modified acyl-coenzyme A (acyl-CoA), a polyketide, a cannabinoid, e.g., CBGA, CBCA, any precursor thereof, or any combination thereof, in a cell, a tissue, or an organism, wherein the modified further comprises an acyl group, a glycan (e.g., glycosylated), or both.

Expressing a polynucleotide within a cell is well known to one skilled in the art. It can be carried out by, among many methods, transfection, viral infection, or direct alteration of the cell's genome. In some embodiments, the DNA molecule is in an expression vector such as plasmid or viral vector. A vector nucleic acid sequence generally contains at least an origin of replication for propagation in a cell and optionally additional elements, such as a heterologous polynucleotide sequence, expression control element (e.g., a promoter, enhancer), selectable marker (e.g., antibiotic resistance), poly-Adenine sequence.

The vector may be a DNA plasmid delivered via non-viral methods or via viral methods. The viral vector may be a retroviral vector, a herpesviral vector, an adenoviral vector, an adeno-associated viral vector, a virgaviridae viral vector, or a poxviral vector. The barley stripe mosaic virus (BSMV), the tobacco rattle virus and the cabbage leaf curl geminivirus (CbLCV) may also be used. The promoters may be active in plant cells. The promoters may be a viral promoter.

In some embodiments, the DNA molecule as disclosed herein is operably linked to a promoter. The term “operably linked” is intended to mean that the nucleotide sequence of interest is linked to the regulatory element or elements in a manner that allows for expression of the nucleotide sequence (e.g., in an in vitro transcription/translation system or in a host cell when the vector is introduced into the host cell). In some embodiments, the promoter is operably linked to the polynucleotide of the invention. In some embodiments, the promoter is a heterologous promoter. In some embodiments, the promoter is the endogenous promoter.

In some embodiments, the vector is introduced into the cell by standard methods including electroporation (e.g., as described in From et al., Proc. Natl. Acad. Sci. USA 82, 5824 (1985)), heat shock, infection by viral vectors, high velocity ballistic penetration by small particles with the nucleic acid either within the matrix of small beads or particles, or on the surface (Klein et al., Nature 327. 70-73 (1987)), such as biolistic use of coated particles, and needle-like particles, Agrobacterium Ti plasmids and/or the like. The term “promoter” as used herein refers to a group of transcriptional control modules that are clustered around the initiation site for an RNA polymerase i.e., RNA polymerase II. Promoters are composed of discrete functional modules, each consisting of approximately 7-20 bp of DNA, and containing one or more recognition sites for transcriptional activator or repressor proteins. The promoter may extend upstream or downstream of the transcriptional start site and may be any size ranging from a few base pairs to several kilo-bases.

In some embodiments, the DNA molecule is transcribed by RNA polymerase II (RNAP II and Pol II). RNAP II is an enzyme found in eukaryotic cells, known to catalyze the transcription of DNA to synthesize precursors of mRNA and most snRNA and microRNA.

In some embodiments, a plant expression vector is used. In one embodiment, the expression of a polypeptide coding sequence is driven by a number of promoters. In some embodiments, viral promoters such as the 35S RNA and 19S RNA promoters of CaMV [Brisson et al., Nature 310:511-514 (1984)], or the coat protein promoter to TMV [Takamatsu et al., EMBO J. 6:307-311 (1987)] are used. In another embodiment, plant promoters are used such as, for example, the small subunit of RUBISCO [Coruzzi et al., EMBO J. 3:1671-1680 (1984); and Brogli et al., Science 224:838-843 (1984)] or heat shock promoters, e.g., soybean hsp17.5-E or hsp17.3-B [Gurley et al., Mol. Cell. Biol. 6:559-565 (1986)]. In one embodiment, constructs are introduced into plant cells using Ti plasmid, Ri plasmid, plant viral vectors, direct DNA transformation, microinjection, electroporation and other techniques well known to the skilled artisan. See, for example, Weissbach & Weissbach [Methods for Plant Molecular Biology, Academic Press, NY, Section VIII, pp 421-463 (1988)]. Other expression systems such as insects and mammalian host cell systems, which are well known in the art, can also be used by the present invention.

In some embodiments, expression vectors containing regulatory elements from eukaryotic viruses such as retroviruses are used by the present invention. SV40 vectors include pSVT7 and pMT2. In some embodiments, vectors derived from bovine papilloma virus include pBV-IMTHA, and vectors derived from Epstein Bar virus include pHEBO, and p205. Other exemplary vectors include pMSG, pAV009/A+, pMTO10/A+, pMAMneo-5, baculovirus pDSVE, and any other vector allowing expression of proteins under the direction of the SV-40 early promoter, SV-40 later promoter, metallothionein promoter, murine mammary tumor virus promoter, Rous sarcoma virus promoter, polyhedrin promoter, or other promoters shown effective for expression in eukaryotic cells.

In some embodiments, recombinant viral vectors, which offer advantages such as systemic infection and targeting specificity, are used for in vivo expression. In one embodiment, systemic infection is inherent in the life cycle of, for example, the retrovirus and is the process by which a single infected cell produces many progeny virions that infect neighboring cells. In one embodiment, the result is that a large area becomes rapidly infected, most of which was not initially infected by the original viral particles. In one embodiment, viral vectors are produced that are unable to spread systemically. In one embodiment, this characteristic can be useful if the desired purpose is to introduce a specified gene into only a localized number of targeted cells.

In some embodiments, plant viral vectors are used. In some embodiments, a wild-type virus is used. In some embodiments, a deconstructed virus such as are known in the art is used. In some embodiments, Agrobacterium is used to introduce the vector of the invention into a virus.

Various methods can be used to introduce the expression vector of the present invention into cells. Such methods are generally described in Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Springs Harbor Laboratory, New York (1989, 1992), in Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Md. (1989), Chang et al., Somatic Gene Therapy, CRC Press, Ann Arbor, Mich. (1995), Vega et al., Gene Targeting, CRC Press, Ann Arbor Mich. (1995), Vectors: A Survey of Molecular Cloning Vectors and Their Uses, Butterworths, Boston Mass. (1988) and Gilboa et at. [Biotechniques 4 (6): 504-512, 1986] and include, for example, stable or transient transfection, lipofection, electroporation, agrobacterium Ti plasmids and infection with recombinant viral vectors. In addition, see U.S. Pat. Nos. 5,464,764 and 5,487,992 for positive-negative selection methods.

It will be appreciated that other than containing the necessary elements for the transcription and translation of the inserted coding sequence (encoding the polypeptide), the expression construct of the present invention can also include sequences engineered to optimize stability, production, purification, yield, or activity of the expressed polypeptide.

In some embodiments, the artificial vector comprises a polynucleotide encoding a protein comprising an amino acid sequence as described herein.

According to some embodiments, there is provided a protein encoded by: (a) the DNA molecule disclosed herein; (b) the artificial vector disclosed herein; or the plasmid or agrobacterium disclosed herein.

In some embodiments, the protein is an isolated protein.

As used herein, the terms “peptide”, “polypeptide” and “protein” are interchangeable and refer to a polymer of amino acid residues. In another embodiment, the terms “peptide”, “polypeptide” and “protein” as used herein encompass native peptides, peptidomimetics (typically including non-peptide bonds or other synthetic modifications) and the peptide analogues peptoids and semipeptoids or any combination thereof. In another embodiment, the peptides, polypeptides and proteins described have modifications rendering them more stable while in the organism or more capable of penetrating into cells. In one embodiment, the terms “peptide”, “polypeptide” and “protein” apply to naturally occurring amino acid polymers. In another embodiment, the terms “peptide”, “polypeptide” and “protein” apply to amino acid polymers in which one or more amino acid residue is an artificial chemical analogue of a corresponding naturally occurring amino acid.

As used herein, the terms “isolated protein” refers to a protein that is essentially free from contaminating cellular components, such as carbohydrate, lipid, or other proteinaceous impurities associated with the nucleic acid in nature. Typically, a preparation of an isolated protein contains the protein in a highly purified form, e.g., at least about 80% pure, at least about 90% pure, at least about 95% pure, greater than 95% pure, or greater than 99% pure. In some embodiments, the isolated protein is a synthesized protein. Synthesis of protein is well known in the art and may be performed, for example, by heterologous expression in a transformed cell, such as exemplified herein.