Humanized antibodies with ultralong complementary determining regions

FIELD

The present disclosure relates to humanized antibodies, including antibodies comprising an ultralong CDR3.

The instant application contains a Sequence Listing which has been submitted in ASCII format via EFS-Web and is hereby incorporated by reference in its entirety. Said ASCII copy, created on Jan. 15, 2016, is named 13379-006-999_SequenceListing.txt and is 686,423 bytes in size.

BACKGROUND

Antibodies are natural proteins that the vertebrate immune system forms in response to foreign substances (antigens), primarily for defense against infection. For over a century, antibodies have been induced in animals under artificial conditions and harvested for use in therapy or diagnosis of disease conditions, or for biological research. Each individual antibody producing cell produces a single type of antibody with a chemically defined composition, however, antibodies obtained directly from animal serum in response to antigen inoculation actually comprise an ensemble of non-identical molecules (e.g., polyclonal antibodies) made from an ensemble of individual antibody producing cells.

Some bovine antibodies have unusually long VH CDR3 sequences compared to other vertebrates. For example, about 10% of IgM contains “ultralong” CDR3 sequences, which can be up to 61 amino acids long. These unusual CDR3 s often have multiple cysteines. Functional VH genes form through a process called V(D)J recombination, wherein the D-region encodes a significant proportion of CDR3. A unique D-region encoding an ultralong sequence has been identified in cattle. Ultralong CDR3s are partially encoded in the cattle genome, and provide a unique characteristic of their antibody repertoire in comparison to humans. Kaushik et al. (U.S. Pat. Nos. 6,740,747 and 7,196,185) disclose several bovine germline D-gene sequences unique to cattle stated to be useful as probes and a bovine VDJ cassette stated to be useful as a vaccine vector.

SUMMARY

The present disclosure provides humanized antibodies, including antibodies comprising an ultralong CDR3, methods of making same, and uses thereof.

In some embodiments, the humanized antibody or binding fragment thereof comprises one or more human variable region framework sequences.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 is 35 amino acids in length or longer, 40 amino acids in length or longer, 45 amino acids in length or longer, 50 amino acids in length or longer, 55 amino acids in length or longer, or 60 amino acids in length or longer.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 is 35 amino acids in length or longer.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 3 or more cysteine residues, 4 or more cysteine residues, 5 or more cysteine residues, 6 or more cysteine residues, 7 or more cysteine residues, 8 or more cysteine residues, 9 or more cysteine residues, 10 or more cysteine residues, 11 or more cysteine residues, or 12 or more cysteine residues.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 3 or more cysteine residues.

In some embodiments of each or any of the above or below mentioned embodiments, the antibodies or binding fragments thereof comprise a cysteine motif.

In some embodiments of each or any of the above or below mentioned embodiments, the cysteine motif is selected from the group consisting of: CX₁₀CX₅CX₅CXCX₇C (SEQ ID NO: 41), CX₁₀CX₆CX₅CXCX₁₅C (SEQ ID NO: 42), CX₁₁CXCX₅C (SEQ ID NO: 43), CX₁₁CX₅CX₅CXCX₇C (SEQ ID NO: 44), CX₁₀CX₆CX₅CXCX₁₃C (SEQ ID NO: 45), CX₁₀CX₅CXCX₄CX₅C (SEQ ID NO: 46), CX₁₀CX₆CX₆CXCX₇C (SEQ ID NO: 47), CX₁₀CX₄CX₇CXCX₅C (SEQ ID NO: 48), CX₁₀CX₄CX₇CXCX₇C (SEQ ID NO: 49), CX₁₃CX₅CX₅C (SEQ ID NO: 50), CX₁₀CX₆CX₅CXCX₇C (SEQ ID NO: 51), CX₁₀CX₅CX₅C (SEQ ID NO: 52), CX₁₀CX₅CX₆CXCX₇C (SEQ ID NO: 53), CX₁₀CX₆CX₅CX₇CX₉C (SEQ ID NO: 54), CX₉CX₇CX₅CXCX₇C (SEQ ID NO: 55), CX₁₀CX₆CX₅CXCX₉C (SEQ ID NO: 56), CX₁₀CXCX₄CX₅CX₁₁C (SEQ ID NO: 57), CX₇CX₃CX₆CX₅CXCX₅CX₁₀C (SEQ ID NO: 58), CX₁₀CXCX₄CX₅CXCX₂CX₃C (SEQ ID NO: 59), CX₁₆CX₅CXC (SEQ ID NO: 60), CX₆CX₄CXCX₄CX₅C (SEQ ID NO: 61), CX₁₁CX₄CX₅CX₆CX₃C (SEQ ID NO: 62), CX₅CX₂CX₆CX₅C (SEQ ID NO: 63), CX₁₀CX₅CX₅CXCX₁₀C (SEQ ID NO: 64), CX₁₀CXCX₆CX₄CXC (SEQ ID NO: 65), CX₁₀CX₅CX₅CXCX₂C (SEQ ID NO: 66), CX₁₄CX₂CX₃CXCXC (SEQ ID NO: 67), CX₁₅CX₅CXC (SEQ ID NO: 68), CX₄CX₆CX₉CX₂CX₁₁C (SEQ ID NO: 69), CX₆CX₄CX₅CX₅CX₁₂C (SEQ ID NO: 70), CX₇CX₃CXCXCX₄CX₅CX₉C (SEQ ID NO: 71), CX₁₀CX₆CX₅C (SEQ ID NO: 72), CX₇CX₃CX₅CX₅CX₉C (SEQ ID NO: 73), CX₇CX₅CXCX₂C (SEQ ID NO: 74), CX₁₀CXCX₆C (SEQ ID NO: 75), CX₁₀CX₃CX₃CX₅CX₇CXCX₆C (SEQ ID NO: 76), CX₁₀CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 77), CX₁₂CX₄CX₅CXCXCX₉CX₃C (SEQ ID NO: 78), CX₁₂CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 79), CX₁₀CX₆CX₅CXCX₁₁C (SEQ ID NO: 80), CX₁₆CX₅CXCXCX₁₄C (SEQ ID NO: 81), CX₁₀CX₅CXCX₅CX₆C (SEQ ID NO: 82), CX₁₂CX₄CX₅CX₅CX₂C (SEQ ID NO: 83), CX₁₂CX₅CX₅CXCX₅C (SEQ ID NO: 84), CX₁₀CX₆CX₅CXCX₄CXCX₉C (SEQ ID NO: 85), CX₁₁CX₄CX₅CX₅CX₂C (SEQ ID NO: 86), CX₁₀CX₆CX₅CX₅CX₂C (SEQ ID NO: 87), CX₁₀CX₆CX₅CXCX₅C (SEQ ID NO: 88), CX₁₀CX₆CXCXCX₃CX₅CX₂C (SEQ ID NO: 89), CX₁₀CX₆CX₅CX₃CX₅C (SEQ ID NO: 90), CX₁₀CX₆CX₅CXCX₂CX₆CX₅C (SEQ ID NO: 91), CX₇CX₆CX₃CX₃CX₉C (SEQ ID NO: 92), CX₉CX₅CX₅CX₆CX₅C (SEQ ID NO: 93), CX₁₀CX₂CX₂CX₇CXCX₁₁CX₅C (SEQ ID NO: 94), and CX₁₀CX₆CX₅CXCX₂CX₈CX₄C (SEQ ID NO: 95).

In some embodiments of each or any of the above or below mentioned embodiments, the cysteine motif is selected from the group consisting of: CCX₃CXCX₃CX₂CCXCX₅CX₉CX₅CXC (SEQ ID NO: 96), CX₆CX₂CX₅CX₄CCXCX₄CX₆CXC (SEQ ID NO: 97), CX₇CXCX₅CX₄CCCX₄CX₆CXC (SEQ ID NO: 98), CX₉CX₃CXCX₂CXCCCX₆CX₄C (SEQ ID NO: 99), CX₅CX₃CXCX₄CX₄CCX₁₀CX₂CC (SEQ ID NO: 100), CX₅CXCX₁CXCX₃CCX₃CX₄CX₁₀C (SEQ ID NO: 101), CX₉CCCX₃CX₄CCCX₅CX₆C (SEQ ID NO: 102), CCX₈CX₅CX₄CX₃CX₄CCXCX₁C (SEQ ID NO: 103), CCX₆CCX₅CCCX₄CX₄CX₁₂C (SEQ ID NO: 104), CX₆CX₂CX₃CCCX₄CX₅CX₃CX₃C (SEQ ID NO: 105), CX₃CX₅CX₆CX₄CCXCX₅CX₄CXC (SEQ ID NO: 106), CX₄CX₄CCX₄CX₄CXCX₁₁CX₂CXC (SEQ ID NO: 107), CX₅CX₂CCX₅CX₄CCX₃CCX₇C (SEQ ID NO: 108), CX₅CX₅CX₃CX₂CXCCX₄CX₇CXC (SEQ ID NO: 109), CX₃CX₇CX₃CX₄CCXCX₂CX₅CX₂C (SEQ ID NO: 110), CX₉CX₃CXCX₄CCX₅CCCX₆C (SEQ ID NO: 111), CX₉CX₃CXCX₂CXCCX₆CX₃CX₃C (SEQ ID NO: 112), CX₅CCXCX₃CCX₃CXCX₃CX₄C (SEQ ID NO: 113), CX₉CCX₄CX₂CXCCXCX₄CX₃C (SEQ ID NO: 114), CX₁₀CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 115), CX₉CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 116), CX₆CCXCX₅CX₄CCXCX₅CX₂C (SEQ ID NO: 117), CX₆CCXCX₃CXCCX₃CX₄CC (SEQ ID NO: 118), CX₆CCXCX₃CXCX₂CXCX₄CX₅C (SEQ ID NO: 119), CX₄CX₂CCX₃CXCX₄CCX₂CX₃C (SEQ ID NO: 120), CX₃CX₅CX₃CCCX₄CX₉C (SEQ ID NO: 121), CCX₉CX₃CXCCX₃CX₅C (SEQ ID NO: 122), CX₉CX₂CX₃CX₄CCX₄CX₅C (SEQ ID NO: 123), CX₉CX₇CX₄CCXCX₇CX₃C (SEQ ID NO: 124), CX₉CX₃CCCX₁₀CX₂CX₃C (SEQ ID NO: 125), CX₃CX₅CXCX₄CCX₁₀CX₆C (SEQ ID NO: 126), CX₉CX₅CX₄CCXCX₅CX₄C (SEQ ID NO: 127), CX₇CXCX₆CX₄CCCX₁₀C (SEQ ID NO: 128), CX₅CX₂CX₄CCX₄CX₃CX₃C (SEQ ID NO: 129), CX₇CX₅CXCX₄CCX₇CX₄C (SEQ ID NO: 130), CX₁₁CX₃CX₄CCCX₅CX₂C (SEQ ID NO: 131), CX₂CX₃CX₄CCX₄CX₅CX₁₅C (SEQ ID NO: 132), CX₉CX₅CX₄CCX₇C (SEQ ID NO: 133), CX₉CX₇CX₃CX₂CX₆C (SEQ ID NO: 134), CX₉CX₅CX₄CCX₁₄C (SEQ ID NO: 135), CX₉CX₅CX₄CCX₈C (SEQ ID NO: 136), CX₉CX₆CX₄CCXC (SEQ ID NO: 137), CX₅CCX₇CX₄CX₁₂(SEQ ID NO: 138), CX₁₀CX₃CX₄CCX₄C (SEQ ID NO: 139), CX₉CX₄CCX₅CX₄C (SEQ ID NO: 140), CX₁₀CX₃CX₄CX₇CXC (SEQ ID NO: 141), CX₇CX₇CX₂CX₂CX₃C (SEQ ID NO: 142), CX₉CX₄CX₄CCX₆C (SEQ ID NO: 143), CX₇CXCX₃CXCX₆C (SEQ ID NO: 144), CX₇CXCX₄CXCX₄C (SEQ ID NO: 145), CX₉CX₅CX₄C (SEQ ID NO: 146), CX₃CX₆CX₈C (SEQ ID NO: 147), CX₁₀CXCX₄C (SEQ ID NO: 148), CX₁₀CCX₄C (SEQ ID NO: 149), CX₁₅C (SEQ ID NO: 150), CX₁₀C (SEQ ID NO: 151), and CX₉C (SEQ ID NO: 152).

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 2 to 6 disulfide bonds.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises SEQ ID NO: 40 or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises amino acid residues 3-6 of any of one SEQ ID NO: 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a non-human DH or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the non-human DH is SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, or SEQ ID NO: 12.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a JH sequence or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the JH sequence comprises amino acids at positions 5-15 of SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, or SEQ ID NO: 17.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a sequence derived from a non-human or human VH sequence (e.g., a germline VH) or a derivative thereof; a sequence derived from a non-human DH sequence or a derivative thereof; and/or a sequence derived from a JH sequence or derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises an additional amino acid sequence comprising two to six amino acid residues or more positioned between the VH sequence and the DH sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the additional amino acid sequence is selected from the group consisting of: IR, IF, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 or SEQ ID NO: 21.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a sequence derived from or based on SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, or SEQ ID NO: 28.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a bovine sequence, a non-bovine sequence, an antibody sequence, or a non-antibody sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is a synthetic sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is a cytokine sequence, a lymphokine sequence, a chemokine sequence, a growth factor sequence, a hormone sequence, or a toxin sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is an IL-8 sequence, an IL-21 sequence, an IL-1 sequence, an IL-2 sequence, an IL-4 sequence, an IL-10 sequence, an IL-17 sequence, an GLP-1 sequence, an SDF-1 (alpha) sequence, a somatostatin sequence, a chlorotoxin sequence, a Pro-TxII sequence, a ziconotide sequence, an ADWX-1 sequence, an HsTx1 sequence, an OSK1 sequence, a Pi2 sequence, a Hongotoxin (HgTX) sequence, a Margatoxin sequence, an Agitoxin-2 sequence, a Pi3 sequence, a Kaliotoxin sequence, an Anuroctoxin sequence, a Charybdotoxin sequence, a Tityustoxin-K-alpha sequence, a Maurotoxin sequence, a Ceratotoxin 1 (CcoTx1) sequence, a CcoTx2 sequence, a CcoTx3 sequence, a Phrixotoxin 3 (PaurTx3) sequence, a Hanatoxin 1 sequence, a Phrixotoxin 1 sequence, a Huwentoxin-IV sequence, an α-conotoxin ImI sequence, an α-conotoxin EpI sequence, an α-conotoxin PnIA sequence, an α-conotoxin PnIB sequence, an α-conotoxin MII sequence, an α-conotoxin AuIA sequence, an α-conotoxin AuIB sequence, an α-conotoxin AuIC sequence, a conotoxin κ-PVIIA sequence, a charybdotoxin sequence, a neurotoxin B-IV sequence, a crotamine sequence, a ω-GVIA (conotoxin) sequence, a κ-hefutoxin 1 sequence, a Css4 sequence, a Bj-xtrIT sequence, a BcIV sequence, a Hm-1 sequence, a Hm-2 sequence, a GsAF-I (β-theraphotoxin-Gr1b) sequence, a Protoxin I (ProTx-I sequence, a β-theraphotoxin-Tp1a) sequence, a Protoxin II (ProTx II) sequence, a Huwentoxin I sequence, a μ-Conotoxin PIIIA sequence, a Jingzhaotoxin-III (β-TRTX-Cj1α) sequence, a GsAF-II (Kappa-theraphotoxin-Gr2c) sequence, a ShK (Stichodactyla toxin) sequence, a HsTx1 sequence, a Guangxitoxin 1E (GxTx-1E) sequence, a Maurotoxin sequence, a Charybdotoxin (ChTX) sequence, an Iberiotoxin (IbTx) sequence, a Leiurotoxin 1 (scyllatoxin) sequence, a Tamapin sequence, a Kaliotoxin-1 (KTX) sequence, a Purotoxin 1 (PT-1) sequence, or a GpTx-1 sequence, a MOKA Toxin sequence, a OSK1 (P12, K16, D20) sequence, a OSK1 (K16, D20) sequence, a HmK sequence, a ShK (K16,Y26, K29) sequence, a ShK (K16) sequence, a ShK-A (K16) sequence, a ShK (K16,E30) sequence, a ShK (Q21) sequence, a ShK (L21) sequence, a ShK (F21) sequence, a ShK (121) sequence, or a ShK (A21) sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is any one of SEQ ID NOS: 475-481, 599-655, 666-698, 727-733, 808-810 and 831-835.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises an antibody heavy chain variable region comprising an amino acid sequence selected from the group consisting of SEQ ID NO: 770-779, 784-791, 903-922 and 925-955.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a light chain variable region comprising an amino acid sequence SEQ ID NO: 780 or 807.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a heavy chain variable region and a light chain variable region, wherein the antibody heavy chain variable region comprises an amino acid sequence selected from the group consisting of SEQ ID NO: 770-779, 784-791, 903-922 and 925-955, and the light chain variable region comprising the amino acid sequence of SEQ ID NO: 959. In some aspects, the antibody heavy chain variable region comprises the amino acid sequence of SEQ ID NO: 941, and the light chain variable region comprising the amino acid sequence of SEQ ID NO: 959.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a heavy chain variable region and a light chain variable region, wherein the antibody heavy chain variable region comprises an amino acid sequence selected from the group consisting of SEQ ID NO: 770-779, 784-791, 903-922 and 925-955, and wherein the light chain variable region comprising the amino acid sequence of SEQ ID NO: 956.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence replaces at least a portion of the ultralong CDR3.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence (e.g., a non-antibody human sequence) is inserted into the CDR3, including optionally, wherein a portion of CDR3 (e.g., one or more amino acids of the CDR3) or the entire CDR3 sequence (e.g., all or substantially all of the amino acids of the CDR3) is removed.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q).

In some embodiments of each or any of the above or below mentioned embodiments, the X¹X²X³X⁴X⁵motif is TTVHQ (SEQ ID NO: 153), TSVHQ (SEQ ID NO: 154), SSVTQ (SEQ ID NO: 155), STVHQ (SEQ ID NO: 156), ATVRQ (SEQ ID NO: 157), TTVYQ (SEQ ID NO: 158), SPVHQ (SEQ ID NO: 159), ATVYQ (SEQ ID NO: 160), TAVYQ (SEQ ID NO: 161), TNVHQ (SEQ ID NO: 162), ATVHQ (SEQ ID NO: 163), STVYQ (SEQ ID NO: 164), TIVHQ (SEQ ID NO: 165), AIVYQ (SEQ ID NO: 166), TTVFQ (SEQ ID NO: 167), AAVFQ (SEQ ID NO: 168), GTVHQ (SEQ ID NO: 169), ASVHQ (SEQ ID NO: 170), TAVFQ (SEQ ID NO: 171), ATVFQ (SEQ ID NO: 172), AAAHQ (SEQ ID NO: 173), VVVYQ (SEQ ID NO: 174), GTVFQ (SEQ ID NO: 175), TAVHQ (SEQ ID NO: 176), ITVHQ (SEQ ID NO: 177), ITAHQ (SEQ ID NO: 178), VTVHQ (SEQ ID NO: 179); AAVHQ (SEQ ID NO: 180), GTVYQ (SEQ ID NO: 181), TTVLQ (SEQ ID NO: 182), TTTHQ (SEQ ID NO: 183), or TTDYQ (SEQ ID NO: 184).

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a CX¹X²X³X⁴X⁵motif.

In some embodiments of each or any of the above or below mentioned embodiments, the CX¹X²X³X⁴X⁵motif is CTTVHQ (SEQ ID NO: 185), CTSVHQ (SEQ ID NO: 186), CSSVTQ (SEQ ID NO: 187), CSTVHQ (SEQ ID NO: 188), CATVRQ (SEQ ID NO: 189), CTTVYQ (SEQ ID NO: 190), CSPVHQ (SEQ ID NO: 191), CATVYQ (SEQ ID NO: 192), CTAVYQ (SEQ ID NO: 193), CTNVHQ (SEQ ID NO: 194), CATVHQ (SEQ ID NO: 195), CSTVYQ (SEQ ID NO: 196), CTIVHQ (SEQ ID NO: 197), CAIVYQ (SEQ ID NO: 198), CTTVFQ (SEQ ID NO: 199), CAAVFQ (SEQ ID NO: 200), CGTVHQ (SEQ ID NO: 201), CASVHQ (SEQ ID NO: 202), CTAVFQ (SEQ ID NO: 203), CATVFQ (SEQ ID NO: 204), CAAAHQ (SEQ ID NO: 205), CVVVYQ (SEQ ID NO: 206), CGTVFQ (SEQ ID NO: 207), CTAVHQ (SEQ ID NO: 208), CITVHQ (SEQ ID NO: 209), CITAHQ (SEQ ID NO: 210), CVTVHQ (SEQ ID NO: 211); CAAVHQ (SEQ ID NO: 212), CGTVYQ (SEQ ID NO: 213), CTTVLQ (SEQ ID NO: 214), CTTTHQ (SEQ ID NO: 215), or CTTDYQ (SEQ ID NO: 216).

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a (X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the (X^aX^b)_zmotif is CYTYNYEF (SEQ ID NO: 217), HYTYTYDF (SEQ ID NO: 218), HYTYTYEW (SEQ ID NO: 219), KHRYTYEW (SEQ ID NO: 220), NYIYKYSF (SEQ ID NO: 221), PYIYTYQF (SEQ ID NO: 222), SFTYTYEW (SEQ ID NO: 223), SYIYIYQW (SEQ ID NO: 224), SYNYTYSW (SEQ ID NO: 225), SYSYSYEY (SEQ ID NO: 226), SYTYNYDF (SEQ ID NO: 227), SYTYNYEW (SEQ ID NO: 228), SYTYNYQF (SEQ ID NO: 229), SYVWTHNF (SEQ ID NO: 230), TYKYVYEW (SEQ ID NO: 231), TYTYTYEF (SEQ ID NO: 232), TYTYTYEW (SEQ ID NO: 233), VFTYTYEF (SEQ ID NO: 234), AYTYEW (SEQ ID NO: 235), DYIYTY (SEQ ID NO: 236), IHSYEF (SEQ ID NO: 237), SFTYEF (SEQ ID NO: 238), SHSYEF (SEQ ID NO: 239), THTYEF (SEQ ID NO: 240), TWTYEF (SEQ ID NO: 241), TYNYEW (SEQ ID NO: 242), TYSYEF (SEQ ID NO: 243), TYSYEH (SEQ ID NO: 244), TYTYDF (SEQ ID NO: 245), TYTYEF (SEQ ID NO: 246), TYTYEW (SEQ ID NO: 247), AYEF (SEQ ID NO: 248), AYSF (SEQ ID NO: 249), AYSY (SEQ ID NO: 250), CYSF (SEQ ID NO: 251), DYTY (SEQ ID NO: 252), KYEH (SEQ ID NO: 253), KYEW (SEQ ID NO: 254), MYEF (SEQ ID NO: 255), NWIY (SEQ ID NO: 256), NYDY (SEQ ID NO: 257), NYQW (SEQ ID NO: 258), NYSF (SEQ ID NO: 259), PYEW (SEQ ID NO: 260), RYNW (SEQ ID NO: 261), RYTY (SEQ ID NO: 262), SYEF (SEQ ID NO: 263), SYEH (SEQ ID NO: 264), SYEW (SEQ ID NO: 265), SYKW (SEQ ID NO: 266), SYTY (SEQ ID NO: 267), TYDF (SEQ ID NO: 268), TYEF (SEQ ID NO: 269), TYEW (SEQ ID NO: 270), TYQW (SEQ ID NO: 271), TYTY (SEQ ID NO: 272), or VYEW (SEQ ID NO: 273).

In some embodiments of each or any of the above or below mentioned embodiments, the (X^aX^b)_zmotif is YXYXYX.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵X_nmotif, wherein X₁is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X₂is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X₃is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X₄is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), wherein X₅is glutamine (Q), and wherein n is 27-54.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises X_n(X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), wherein n is 27-54, and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵X_n(X^aX^b)_zmotif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q), wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), wherein n is 27-54, and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the X¹X²X³X⁴X⁵motif is TTVHQ (SEQ ID NO: 153) or TSVHQ (SEQ ID NO: 154), and wherein the (X^aX^b)_zmotif is YXYXYX.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a CX¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q); a cysteine motif selected from the group consisting of: CX₁₀CX₅CX₅CXCX₇C (SEQ ID NO: 41), CX₁₀CX₆CX₅CXCX₁₅C (SEQ ID NO: 42), CX₁₁CXCX₅C (SEQ ID NO: 43), CX₁₁CX₅CX₅CXCX₇C (SEQ ID NO: 44), CX₁₀CX₆CX₅CXCX₁₃C (SEQ ID NO: 45), CX₁₀CX₅CXCX₄CX₈C (SEQ ID NO: 46), CX₁₀CX₆CX₆CXCX₇C (SEQ ID NO: 47), CX₁₀CX₄CX₇CXCX₈C (SEQ ID NO: 48), CX₁₀CX₄CX₇CXCX₇C (SEQ ID NO: 49), CX₁₃CX₈CX₈C (SEQ ID NO: 50), CX₁₀CX₆CX₅CXCX₇C (SEQ ID NO: 51), CX₁₀CX₅CX₅C (SEQ ID NO: 52), CX₁₀CX₅CX₆CXCX₇C (SEQ ID NO: 53), CX₁₀CX₆CX₅CX₇CX₉C (SEQ ID NO: 54), CX₉CX₇CX₅CXCX₇C (SEQ ID NO: 55), CX₁₀CX₆CX₅CXCX₉C (SEQ ID NO: 56), CX₁₀CXCX₄CX₅CX₁₁C (SEQ ID NO: 57), CX₇CX₃CX₆CX₅CXCX₅CX₁₀C (SEQ ID NO: 58), CX₁₀CXCX₄CX₅CXCX₂CX₃C (SEQ ID NO: 59), CX₁₆CX₅CXC (SEQ ID NO: 60), CX₆CX₄CXCX₄CX₅C (SEQ ID NO: 61), CX₁₁CX₄CX₅CX₆CX₃C (SEQ ID NO: 62), CX₅CX₂CX₆CX₅C (SEQ ID NO: 63), CX₁₀CX₅CX₅CXCX₁₀C (SEQ ID NO: 64), CX₁₀CXCX₆CX₄CXC (SEQ ID NO: 65), CX₁₀CX₅CX₅CXCX₂C (SEQ ID NO: 66), CX₁₄CX₂CX₃CXCXC (SEQ ID NO: 67), CX₁₅CX₅CXC (SEQ ID NO: 68), CX₄CX₆CX₉CX₂CX₁₁C (SEQ ID NO: 69), CX₆CX₄CX₅CX₅CX₁₂C (SEQ ID NO: 70), CX₇CX₃CXCXCX₄CX₅CX₉C (SEQ ID NO: 71), CX₁₀CX₆CX₅C (SEQ ID NO: 72), CX₇CX₃CX₅CX₅CX₉C (SEQ ID NO: 73), CX₇CX₅CXCX₂C (SEQ ID NO: 74), CX₁₀CXCX₆C (SEQ ID NO: 75), CX₁₀CX₃CX₃CXCX₇CXCX₆C (SEQ ID NO: 76), CX₁₀CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 77), CX₁₂CX₄CX₅CXCXCX₉CX₃C (SEQ ID NO: 78), CX₁₂CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 79), CX₁₀CX₆CX₅CXCX₁₁C (SEQ ID NO: 80), CX₁₆CX₅CXCXCX₁₄C (SEQ ID NO: 81), CX₁₀CX₅CXCX₅CX₆C (SEQ ID NO: 82), CX₁₂CX₄CX₅CX₅CX₂C (SEQ ID NO: 83), CX₁₂CX₅CX₅CXCX₈C (SEQ ID NO: 84), CX₁₀CX₆CX₅CXCX₄CXCX₉C (SEQ ID NO: 85), CX₁₁CX₄CX₅CX₈CX₂C (SEQ ID NO: 86), CX₁₀CX₆CX₅CX₈CX₂C (SEQ ID NO: 87), CX₁₀CX₆CX₅CXCX₈C (SEQ ID NO: 88), CX₁₀CX₆CX₅CXCX₃CX₈CX₂C (SEQ ID NO: 89), CX₁₀CX₆CX₅CX₃CX₈C (SEQ ID NO: 90), CX₁₀CX₆CX₅CXCX₂CX₆CX₅C (SEQ ID NO: 91), CX₇CX₆CX₃CX₃CX₉C (SEQ ID NO: 92), CX₉CX₈CX₅CX₆CX₅C (SEQ ID NO: 93), CX₁₀CX₂CX₂CX₇CXCX₁₁CX₅C (SEQ ID NO: 94), and CX₁₀CX₆CX₅CXCX₂CX₈CX₄C (SEQ ID NO: 95), and a (X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a CX¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q); a cysteine motif selected from the group consisting of: wherein the cysteine motif is selected from the group consisting of: CCX₃CXCX₃CX₂CCXCX₅CX₉CX₅CXC (SEQ ID NO: 96), CX₆CX₂CX₅CX₄CCXCX₄CX₆CXC (SEQ ID NO: 97), CX₇CXCX₅CX₄CCCX₄CX₆CXC (SEQ ID NO: 98), CX₉CX₃CXCX₂CXCCCX₆CX₄C (SEQ ID NO: 99), CX₅CX₃CXCX₄CX₄CCX₁₀CX₂CC (SEQ ID NO: 100), CX₅CXCX₁CXCX₃CCX₃CX₄CX₁₀C (SEQ ID NO: 101), CX₉CCCX₃CX₄CCCX₅CX₆C (SEQ ID NO: 102), CCX₈CX₅CX₄CX₃CX₄CCXCX₁C (SEQ ID NO: 103), CCX₆CCX₅CCCX₄CX₄CX₁₂C (SEQ ID NO: 104), CX₆CX₂CX₃CCCX₄CX₅CX₃CX₃C (SEQ ID NO: 105), CX₃CX₅CX₆CX₄CCXCX₅CX₄CXC (SEQ ID NO: 106), CX₄CX₄CCX₄CX₄CXCX₁₁CX₂CXC (SEQ ID NO: 107), CX₅CX₂CCX₅CX₄CCX₃CCX₇C (SEQ ID NO: 108), CX₅CX₅CX₃CX₂CXCCX₄CX₇CXC (SEQ ID NO: 109), CX₃CX₇CX₃CX₄CCXCX₂CX₅CX₂C (SEQ ID NO: 110), CX₉CX₃CXCX₄CCX₅CCCX₆C (SEQ ID NO: 111), CX₉CX₃CXCX₂CXCCX₆CX₃CX₃C (SEQ ID NO: 112), CX₈CCXCX₃CCX₃CXCX₃CX₄C (SEQ ID NO: 113), CX₉CCX₄CX₂CXCCXCX₄CX₃C (SEQ ID NO: 114), CX₁₀CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 115), CX₉CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 116), CX₆CCXCX₅CX₄CCXCX₅CX₂C (SEQ ID NO: 117), CX₆CCXCX₃CXCCX₃CX₄CC (SEQ ID NO: 118), CX₆CCXCX₃CXCX₂CXCX₄CX₈C (SEQ ID NO: 119), CX₄CX₂CCX₃CXCX₄CCX₂CX₃C (SEQ ID NO: 120), CX₃CX₅CX₃CCCX₄CX₉C (SEQ ID NO: 121), CCX₉CX₃CXCCX₃CX₅C (SEQ ID NO: 122), CX₉CX₂CX₃CX₄CCX₄CX₅C (SEQ ID NO: 123), CX₉CX₇CX₄CCXCX₇CX₃C (SEQ ID NO: 124), CX₉CX₃CCCX₁₀CX₂CX₃C (SEQ ID NO: 125), CX₃CX₅CX₅CX₄CCX₁₀CX₆C (SEQ ID NO: 126), CX₉CX₅CX₄CCXCX₅CX₄C (SEQ ID NO: 127), CX₇CXCX₆CX₄CCCX₁₀C (SEQ ID NO: 128), CX₈CX₂CX₄CCX₄CX₃CX₃C (SEQ ID NO: 129), CX₇CX₅CXCX₄CCX₇CX₄C (SEQ ID NO: 130), CX₁₁CX₃CX₄CCCX₈CX₂C (SEQ ID NO: 131), CX₂CX₃CX₄CCX₄CX₅CX₁₅C (SEQ ID NO: 132), CX₉CX₅CX₄CCX₇C (SEQ ID NO: 133), CX₉CX₇CX₃CX₂CX₆C (SEQ ID NO: 134), CX₉CX₅CX₄CCX₁₄C (SEQ ID NO: 135), CX₉CX₅CX₄CCX₈C (SEQ ID NO: 136), CX₉CX₆CX₄CCXC (SEQ ID NO: 137), CX₅CCX₇CX₄CX₁₂(SEQ ID NO: 138), CX₁₀CX₃CX₄CCX₄C (SEQ ID NO: 139), CX₉CX₄CCX₅CX₄C (SEQ ID NO: 140), CX₁₀CX₃CX₄CX₇CXC (SEQ ID NO: 141), CX₇CX₇CX₂CX₂CX₃C (SEQ ID NO: 142), CX₉CX₄CX₄CCX₆C (SEQ ID NO: 143), CX₇CXCX₃CXCX₆C (SEQ ID NO: 144), CX₇CXCX₄CXCX₄C (SEQ ID NO: 145), CX₉CX₅CX₄C (SEQ ID NO: 146), CX₃CX₆CX₈C (SEQ ID NO: 147), CX₁₀CXCX₄C (SEQ ID NO: 148), CX₁₀CCX₄C (SEQ ID NO: 149), CX₁₅C (SEQ ID NO: 150), CX₁₀C (SEQ ID NO: 151), and CX₉C (SEQ ID NO: 152); and a (X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises an additional sequence that is a linker.

In some embodiments of each or any of the above or below mentioned embodiments, the linker is linked to a C-terminus, a N-terminus, or both C-terminus and N-terminus of the non-antibody sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 is a ruminant CDR3.

In some embodiments of each or any of the above or below mentioned embodiments, the ruminant is a cow.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a human heavy chain variable region framework sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a human heavy chain germline sequence or is a derived from a human heavy chain germline sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the heavy chain variable region comprises an amino acid sequence of SEQ ID NO: 735.

In some embodiments of each or any of the above or below mentioned embodiments, the heavy chain variable region comprises an amino acid sequence of SEQ ID NO: 737.

In some embodiments of each or any of the above or below mentioned embodiments, the heavy chain variable region comprises an amino acid sequence of SEQ ID NO: 739.

In some embodiments of each or any of the above or below mentioned embodiments, the heavy chain variable region comprises an amino acid sequence of SEQ ID NO: 741.

In some embodiments of each or any of the above or below mentioned embodiments, the heavy chain variable region comprises an amino acid sequence of SEQ ID NO: 743.

In some embodiments of each or any of the above or below mentioned embodiments, the heavy chain variable region comprises an amino acid sequence of SEQ ID NO: 745.

In some embodiments of each or any of the above or below mentioned embodiments, the heavy chain variable region comprises an amino acid sequence of SEQ ID NO: 747.

In some embodiments of each or any of the above or below mentioned embodiments, the heavy chain variable region comprises an amino acid sequence of SEQ ID NO: 749.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises an amino acid sequence of: (i) any one of YGPNYEEWGDYLATLDV (SEQ ID NO: 536), GPNYEEWGDYLATLDV (SEQ ID NO: 537), PNYEEWGDYLATLDV (SEQ ID NO: 538), NYEEWGDYLATLDV (SEQ ID NO: 539), YEEWGDYLATLDV (SEQ ID NO: 540), or EEWGDYLATLDV (SEQ ID NO: 541); (ii) any one of YDFYDGYYNYHYMDV (SEQ ID NO: 542), DFYDGYYNYHYMDV (SEQ ID NO: 543), FYDGYYNYHYMDV (SEQ ID NO: 544), YDGYYNYHYMDV (SEQ ID NO: 545), DGYYNYHYMDV (SEQ ID NO: 546), GYYNYHYMDV (SEQ ID NO: 547), or YYNYHYMDV (SEQ ID NO: 548); (iii) any one of YDFNDGYYNYHYMDV (SEQ ID NO: 549), DFYDGYYNYHYMDV (SEQ ID NO: 550), FYDGYYNYHYMDV (SEQ ID NO: 551), YDGYYNYHYMDV (SEQ ID NO: 552), DGYYNYHYMDV (SEQ ID NO: 553), or GYYNYHYMDV (SEQ ID NO: 554); (iv) any one of QGIRYQGSGTFWYFDV (SEQ ID NO: 555), GIRYQGSGTFWYFDV (SEQ ID NO: 556), IRYQGSGTFWYFDV (SEQ ID NO: 557), RYQGSGTFWYFDV (SEQ ID NO: 558), YQGSGTFWYFDV (SEQ ID NO: 559), QGSGTFWYFDV (SEQ ID NO: 560), GSGTFWYFDV (SEQ ID NO: 561), SGTFWYFDV (SEQ ID NO: 562), or GTFWYFDV (SEQ ID NO: 563); (v) any one of YNLGYSYFYYMDG (SEQ ID NO: 564), NLGYSYFYYMDG (SEQ ID NO: 565), LGYSYFYYMDG (SEQ ID NO: 566), GYSYFYYMDG (SEQ ID NO: 567), YSYFYYMDG (SEQ ID NO: 568), or SYFYYMDG (SEQ ID NO: 569); or (vi) SYTYNYEWHVDV (SEQ ID NO: 499).

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises an amino acid sequence of: (i) any one of GSKHRLRDYFLYNE (SEQ ID NO: 501), GSKHRLRDYFLYN (SEQ ID NO: 502), GSKHRLRDYFLY (SEQ ID NO: 503), GSKHRLRDYFL (SEQ ID NO: 504), GSKHRLRDYF (SEQ ID NO: 505), GSKHRLRDY (SEQ ID NO: 506), or GSKHRLRD (SEQ ID NO: 507), and any one of YGPNYEEWGDYLATLDV (SEQ ID NO: 536), GPNYEEWGDYLATLDV (SEQ ID NO: 537), PNYEEWGDYLATLDV (SEQ ID NO: 538), NYEEWGDYLATLDV (SEQ ID NO: 539), YEEWGDYLATLDV (SEQ ID NO: 540), or EEWGDYLATLDV (SEQ ID NO: 541); (ii) any one of EAGGPDYRNGYNY (SEQ ID NO: 508), EAGGPDYRNGYN (SEQ ID NO: 509), EAGGPDYRNGY (SEQ ID NO: 510), EAGGPDYRNG (SEQ ID NO: 511), EAGGPDYRN (SEQ ID NO: 512), EAGGPDYR (SEQ ID NO: 513), EAGGPDY (SEQ ID NO: 514), or EAGGPD (SEQ ID NO: 515), and any one of YDFYDGYYNYHYMDV (SEQ ID NO: 542), DFYDGYYNYHYMDV (SEQ ID NO: 543), FYDGYYNYHYMDV (SEQ ID NO: 544), YDGYYNYHYMDV (SEQ ID NO: 545), DGYYNYHYMDV (SEQ ID NO: 546), GYYNYHYMDV (SEQ ID NO: 547), or YYNYHYMDV (SEQ ID NO: 548); (iii) any one of EAGGPIWHDDVKY (SEQ ID NO: 516), EAGGPIWHDDVK (SEQ ID NO: 517), EAGGPIWHDDV (SEQ ID NO: 518), EAGGPIWHDD (SEQ ID NO: 519), EAGGPIWHD (SEQ ID NO: 520), EAGGPIWH (SEQ ID NO: 521), EAGGPIW (SEQ ID NO: 522), or EAGGPI (SEQ ID NO: 523), and any one of YDFNDGYYNYHYMDV (SEQ ID NO: 549), DFYDGYYNYHYMDV (SEQ ID NO: 550), FYDGYYNYHYMDV (SEQ ID NO: 551), YDGYYNYHYMDV (SEQ ID NO: 552), DGYYNYHYMDV (SEQ ID NO: 553), or GYYNYHYMDV (SEQ ID NO: 554); (iv) any one of GTDYTIDDQGI (SEQ ID NO: 524), GTDYTIDDQG (SEQ ID NO: 525), GTDYTIDDQ (SEQ ID NO: 526), GTDYTIDD (SEQ ID NO: 527), GTDYTID (SEQ ID NO: 528), or GTDYTI (SEQ ID NO: 529), and any one of QGIRYQGSGTFWYFDV (SEQ ID NO: 555), GIRYQGSGTFWYFDV (SEQ ID NO: 556), IRYQGSGTFWYFDV (SEQ ID NO: 557), RYQGSGTFWYFDV (SEQ ID NO: 558), YQGSGTFWYFDV (SEQ ID NO: 559), QGSGTFWYFDV (SEQ ID NO: 560), GSGTFWYFDV (SEQ ID NO: 561), SGTFWYFDV (SEQ ID NO: 562), or GTFWYFDV (SEQ ID NO: 563); (v) any one of YNLGYSYFYYMDG (SEQ ID NO: 564), NLGYSYFYYMDG (SEQ ID NO: 565), LGYSYFYYMDG (SEQ ID NO: 566), GYSYFYYMDG (SEQ ID NO: 567), YSYFYYMDG (SEQ ID NO: 568), or SYFYYMDG (SEQ ID NO: 569), and any one of YNLGYSYFYYMDG (SEQ ID NO: 564), NLGYSYFYYMDG (SEQ ID NO: 565), LGYSYFYYMDG (SEQ ID NO: 566), GYSYFYYMDG (SEQ ID NO: 567), YSYFYYMDG (SEQ ID NO: 568), or SYFYYMDG (SEQ ID NO: 569); or (vi) TSVHQETKKYQS (SEQ ID NO: 498) and SYTYNYEWHVDV (SEQ ID NO: 499).

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a human light chain variable region framework sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the light chain variable comprises a lambda light chain variable region sequence or derived from a lambda light chain variable region sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the light chain variable region sequence comprises a human lambda light chain variable region sequence or derived from a human lambda light chain variable region sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the light chain variable region comprises a VL1-51 germline sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the light chain variable region is derived from a VL1-51 germline sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a CDR1 comprising Ile29Val and Asn32Gly substitution based on Kabat numbering.

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a CDR2 comprising a substitution of DNN to GDT.

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a CDR2 comprising a substitution of DNNKRP (SEQ ID NO: 471) to GDTSRA (SEQ ID NO: 472).

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a S2A, T5N, P8S, A12G, A13S, and P14L substitution based on Kabat numbering.

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a S2A, T5N, P8S, A12G, A13S, and P14L substitution based on Kabat numbering, and a CDR2 comprising a substitution of DNN to GDT.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprising: (a) a heavy chain variable region comprising a sequence selected from the group consisting of SEQ ID NO: 740, SEQ ID NO: 741, SEQ ID NO:742, and SEQ ID NO: 743; and (b) a light chain variable region comprising SEQ ID NO: 750.

The present disclosure also provides polynucleotides encoding the heavy chain variable region of the humanized antibody or binding fragment thereof disclosed herein.

The present disclosure also provides polynucleotides encoding the light chain variable region of the humanized antibody or binding fragment thereof disclosed herein.

The present disclosure also provides polynucleotides encoding a heavy chain variable region that comprises an ultralong CDR3, wherein the polynucleotide comprises a sequence selected from the group consisting of SEQ ID NO: 490, SEQ ID NO: 491, SEQ ID NO: 492, SEQ ID NO: 493, SEQ ID NO: 494, SEQ ID NO: 495, SEQ ID NO: 496, and SEQ ID NO: 497.

The present disclosure also provides vectors that comprise the polynucleotides disclosed herein.

The present disclosure also provides host cells comprising the vectors disclosed herein.

The present disclosure also provides a nucleic acid library comprising a plurality of polynucleotides comprising sequences coding for humanized antibodies or binding fragments thereof, wherein the antibodies or binding fragments thereof comprise a heavy chain variable region comprising: (a) an amino acid sequence selected from the group consisting of: (i) SEQ ID NO: 734 or SEQ ID NO: 735, (ii) SEQ ID NO: 736 or SEQ ID NO: 737, (iii) SEQ ID NO: 738 or SEQ ID NO: 739, (iv) SEQ ID NO: 740 or SEQ ID NO: 741, (v) SEQ ID NO: 742 or SEQ ID NO: 743, (vi) SEQ ID NO: 744 or SEQ ID NO: 745, (vii) SEQ ID NO: 746 or SEQ ID NO 747, and (viii) SEQ ID NO: 748 or SEQ ID NO:749; and (b) an ultralong CDR3.

The present disclosure also provides a library of humanized antibodies or binding fragments thereof, wherein the antibodies or binding fragments thereof comprise (i) SEQ ID NO: 734 or SEQ ID NO: 735, (ii) SEQ ID NO: 736 or SEQ ID NO: 737, (iii) SEQ ID NO: 738 or SEQ ID NO: 739, (iv) SEQ ID NO: 740 or SEQ ID NO: 741, (v) SEQ ID NO: 742 or SEQ ID NO: 743, (vi) SEQ ID NO: 744 or SEQ ID NO: 745, (vii) SEQ ID NO: 746 or SEQ ID NO 747, and (viii) SEQ ID NO: 748 or SEQ ID NO:749; and (b) an ultralong CDR3.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 is 35 amino acids in length or longer.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 3 or more cysteine residues.

In some embodiments of each or any of the above or below mentioned embodiments, the antibodies or binding fragments thereof comprise a cysteine motif.

In some embodiments of each or any of the above or below mentioned embodiments, the cysteine motif is selected from the group consisting of: CX₁₀CX₅CX₅CXCX₇C (SEQ ID NO: 41), CX₁₀CX₆CX₅CXCX₁₅C (SEQ ID NO: 42), CX₁₁CXCX₅C (SEQ ID NO: 43), CX₁₁CX₅CX₅CXCX₇C (SEQ ID NO: 44), CX₁₀CX₆CX₅CXCX₁₃C (SEQ ID NO: 45), CX₁₀CX₅CXCX₄CX₅C (SEQ ID NO: 46), CX₁₀CX₆CX₆CXCX₇C (SEQ ID NO: 47), CX₁₀CX₄CX₇CXCXC (SEQ ID NO: 48), CX₁₀CX₄CX₇CXCX₇C (SEQ ID NO: 49), CX₁₃CX₈CX₈C (SEQ ID NO: 50), CX₁₀CX₆CX₅CXCX₇C (SEQ ID NO: 51), CX₁₀CX₅CX₅C (SEQ ID NO: 52), CX₁₀CX₅CX₆CXCX₇C (SEQ ID NO: 53), CX₁₀CX₆CX₅CX₇CX₉C (SEQ ID NO: 54), CX₉CX₇CX₅CXCX₇C (SEQ ID NO: 55), CX₁₀CX₆CX₅CXCX₉C (SEQ ID NO: 56), CX₁₀CXCX₄CX₅CX₁₁C (SEQ ID NO: 57), CX₇CX₃CX₆CX₅CXCX₅CX₁₀C (SEQ ID NO: 58), CX₁₀CXCX₄CX₅CXCX₂CX₃C (SEQ ID NO: 59), CX₁₆CX₅CXC (SEQ ID NO: 60), CX₆CX₄CXCX₄CX₅C (SEQ ID NO: 61), CX₁₁CX₄CX₅CX₆CX₃C (SEQ ID NO: 62), CX₈CX₂CX₆CX₅C (SEQ ID NO: 63), CX₁₀CX₅CX₅CXCX₁₀C (SEQ ID NO: 64), CX₁₀CXCX₆CX₄CXC (SEQ ID NO: 65), CX₁₀CX₅CX₅CXCX₂C (SEQ ID NO: 66), CX₁₄CX₂CX₃CXCXC (SEQ ID NO: 67), CX₁₅CX₅CXC (SEQ ID NO: 68), CX₄CX₆CX₉CX₂CX₁₁C (SEQ ID NO: 69), CX₆CX₄CX₅CX₅CX₁₂C (SEQ ID NO: 70), CX₇CX₃CXCXCX₄CX₅CX₉C (SEQ ID NO: 71), CX₁₀CX₆CX₅C (SEQ ID NO: 72), CX₇CX₃CX₅CX₅CX₉C (SEQ ID NO: 73), CX₇CX₅CXCX₂C (SEQ ID NO: 74), CX₁₀CXCX₆C (SEQ ID NO: 75), CX₁₀CX₃CX₃CX₅CX₇CXCX₆C (SEQ ID NO: 76), CX₁₀CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 77), CX₁₂CX₄CX₅CXCXCX₉CX₃C (SEQ ID NO: 78), CX₁₂CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 79), CX₁₀CX₆CX₅CXCX₁₁C (SEQ ID NO: 80), CX₁₆CX₅CXCXCX₁₄C (SEQ ID NO: 81), CX₁₀CX₅CXCX₈CX₆C (SEQ ID NO: 82), CX₁₂CX₄CX₅CX₈CX₂C (SEQ ID NO: 83), CX₁₂CX₅CX₅CXCX₈C (SEQ ID NO: 84), CX₁₀CX₆CX₅CXCX₄CXCX₉C (SEQ ID NO: 85), CX₁₁CX₄CX₅CX₈CX₂C (SEQ ID NO: 86), CX₁₀CX₆CX₅CX₈CX₂C (SEQ ID NO: 87), CX₁₀CX₆CX₅CXCX₈C (SEQ ID NO: 88), CX₁₀CX₆CX₅CXCX₃CXCX₂C (SEQ ID NO: 89), CX₁₀CX₆CX₅CX₃CX₈C (SEQ ID NO: 90), CX₁₀CX₆CX₅CXCX₂CX₆CXC (SEQ ID NO: 91), CX₇CX₆CX₃CX₃CX₉C (SEQ ID NO: 92), CX₉CX₈CX₅CX₆CX₅C (SEQ ID NO: 93), CX₁₀CX₂CX₂CX₇CXCX₁₁CX₅C (SEQ ID NO: 94), and CX₁₀CX₆CX₅CXCX₂CX₈CX₄C (SEQ ID NO: 95).

In some embodiments of each or any of the above or below mentioned embodiments, the cysteine motif is selected from the group consisting of: CCX₃CXCX₃CX₂CCXCX₅CX₉CX₅CXC (SEQ ID NO: 96), CX₆CX₂CX₅CX₄CCXCX₄CX₆CXC (SEQ ID NO: 97), CX₇CXCX₅CX₄CCCX₄CX₆CXC (SEQ ID NO: 98), CX₉CX₃CXCX₂CXCCCX₆CX₄C (SEQ ID NO: 99), CX₅CX₃CXCX₄CX₄CCX₁₀CX₂CC (SEQ ID NO: 100), CX₅CXCX₁CXCX₃CCX₃CX₄CX₁₀C (SEQ ID NO: 101), CX₉CCCX₃CX₄CCCX₅CX₆C (SEQ ID NO: 102), CCX₅CX₅CX₄CX₃CX₄CCXCX₁C (SEQ ID NO: 103), CCX₆CCX₅CCCX₄CX₄CX₁₂C (SEQ ID NO: 104), CX₆CX₂CX₃CCCX₄CX₅CX₃CX₃C (SEQ ID NO: 105), CX₃CX₅CX₆CX₄CCXCX₅CX₄CXC (SEQ ID NO: 106), CX₄CX₄CCX₄CX₄CXCX₁₁CX₂CXC (SEQ ID NO: 107), CX₅CX₂CCX₅CX₄CCX₃CCX₇C (SEQ ID NO: 108), CX₅CX₅CX₃CX₂CXCCX₄CX₇CXC (SEQ ID NO: 109), CX₃CX₇CX₃CX₄CCXCX₂CX₅CX₂C (SEQ ID NO: 110), CX₉CX₃CXCX₄CCX₅CCCX₆C (SEQ ID NO: 111), CX₉CX₃CXCX₂CXCCX₆CX₃CX₃C (SEQ ID NO: 112), CX₈CCXCX₃CCX₃CXCX₃CX₄C (SEQ ID NO: 113), CX₉CCX₄CX₂CXCCXCX₄CX₃C (SEQ ID NO: 114), CX₁₀CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 115), CX₉CXCX₃CX₂CXCCX₄CXCXC (SEQ ID NO: 116), CX₆CCXCX₅CX₄CCXCX₅CX₂C (SEQ ID NO: 117), CX₆CCXCX₃CXCCX₃CX₄CC (SEQ ID NO: 118), CX₆CCXCX₃CXCX₂CXCX₄CX₈C (SEQ ID NO: 119), CX₄CX₂CCX₃CXCX₄CCX₂CX₃C (SEQ ID NO: 120), CX₃CX₅CX₃CCCX₄CX₉C (SEQ ID NO: 121), CCX₉CX₃CXCCX₃CX₅C (SEQ ID NO: 122), CX₉CX₂CX₃CX₄CCX₄CX₅C (SEQ ID NO: 123), CX₉CX₇CX₄CCXCX₇CX₃C (SEQ ID NO: 124), CX₉CX₃CCCX₁₀CX₂CX₃C (SEQ ID NO: 125), CX₃CX₅CX₅CX₄CCX₁₀CX₆C (SEQ ID NO: 126), CX₉CX₅CX₄CCXCX₅CX₄C (SEQ ID NO: 127), CX₇CXCX₆CX₄CCCX₁₀C (SEQ ID NO: 128), CX₈CX₂CX₄CCX₄CX₃CX₃C (SEQ ID NO: 129), CX₇CX₅CXCX₄CCX₇CX₄C (SEQ ID NO: 130), CX₁₁CX₃CX₄CCCX₈CX₂C (SEQ ID NO: 131), CX₂CX₃CX₄CCX₄CX₅CX₁₅C (SEQ ID NO: 132), CX₉CX₅CX₄CCX₇C (SEQ ID NO: 133), CX₉CX₇CX₃CX₂CX₆C (SEQ ID NO: 134), CX₉CX₅CX₄CCX₁₄C (SEQ ID NO: 135), CX₉CX₅CX₄CCX₈C (SEQ ID NO: 136), CX₉CX₆CX₄CCXC (SEQ ID NO: 137), CX₅CCX₇CX₄CX₁₂(SEQ ID NO: 138), CX₁₀CX₃CX₄CCX₄C (SEQ ID NO: 139), CX₉CX₄CCX₅CX₄C (SEQ ID NO: 140), CX₁₀CX₃CX₄CX₇CXC (SEQ ID NO: 141), CX₇CX₇CX₂CX₂CX₃C (SEQ ID NO: 142), CX₉CX₄CX₄CCX₆C (SEQ ID NO: 143), CX₇CXCX₃CXCX₆C (SEQ ID NO: 144), CX₇CXCX₄CXCX₄C (SEQ ID NO: 145), CX₉CX₅CX₄C (SEQ ID NO: 146), CX₃CX₆CXC (SEQ ID NO: 147), CX₁₀CXCX₄C (SEQ ID NO: 148), CX₁₀CCX₄C (SEQ ID NO: 149), CX₁₅C (SEQ ID NO: 150), CX₁₀C (SEQ ID NO: 151), and CX₉C (SEQ ID NO: 152).

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 2 to 6 disulfide bonds.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises SEQ ID NO: 40 or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises amino acid residues 3-6 of any of one SEQ ID NO: 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a non-human DH or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a JH sequence or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the JH sequence comprises amino acids as positions 5-15 of SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, or SEQ ID NO: 17.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a sequence derived from a non-human VH sequence or a derivative thereof; a sequence derived from a non-human DH sequence or a derivative thereof; and/or a sequence derived from JH sequence or derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a non-bovine sequence or a non-antibody sequence.

For example, the non-antibody sequence (e.g., a non-antibody human sequence) is inserted into the CDR3, including optionally, wherein a portion of CDR3 (e.g., one or more amino acids of the CDR3) or the entire CDR3 sequence (e.g., all or substantially all of the amino acids of the CDR3) is removed.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is a synthetic sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is an IL-8 sequence, an IL-21 sequence, an SDF-1 (alpha) sequence, a somatostatin sequence, a chlorotoxin sequence, a Pro-TxII sequence, a ziconotide sequence, an ADWX-1 sequence, an HsTx1 sequence, an OSK1 sequence, a Pi2 sequence, a Hongotoxin (HgTX) sequence, a Margatoxin sequence, an Agitoxin-2 sequence, a Pi3 sequence, a Kaliotoxin sequence, an Anuroctoxin sequence, a Charybdotoxin sequence, a Tityustoxin-K-alpha sequence, a Maurotoxin sequence, a Ceratotoxin 1 (CcoTx1) sequence, a CcoTx2 sequence, a CcoTx3 sequence, a Phrixotoxin 3 (PaurTx3) sequence, a Hanatoxin 1 sequence, a Phrixotoxin 1 sequence, a Huwentoxin-IV sequence, an α-conotoxin ImI sequence, an α-conotoxin EpI sequence, an α-conotoxin PnIA sequence, an α-conotoxin PnIB sequence, an α-conotoxin MII sequence, an α-conotoxin AuIA sequence, an α-conotoxin AuIB sequence, an α-conotoxin AuIC sequence, a conotoxin κ-PVIIA sequence, a charybdotoxin sequence, a neurotoxin B-IV sequence, a crotamine sequence, a ω-GVIA (conotoxin) sequence, a κ-hefutoxin 1 sequence, a Css4 sequence, a Bj-xtrIT sequence, a BcIV sequence, a Hm-1 sequence, a Hm-2 sequence, a GsAF-I (β-theraphotoxin-Gr1b) sequence, a Protoxin I (ProTx-I sequence, a β-theraphotoxin-Tp1a) sequence, a Protoxin II (ProTx II) sequence, a Huwentoxin I sequence, a μ-Conotoxin PIIIA sequence, a Jingzhaotoxin-III (β-TRTX-Cj1α) sequence, a GsAF-II (Kappa-theraphotoxin-Gr2c) sequence, a ShK (Stichodactyla toxin) sequence, a HsTx1 sequence, a Guangxitoxin 1E (GxTx-1E) sequence, a Maurotoxin sequence, a Charybdotoxin (ChTX) sequence, an Iberiotoxin (IbTx) sequence, a Leiurotoxin 1 (scyllatoxin) sequence, a Tamapin sequence, a Kaliotoxin-1 (KTX) sequence, a Purotoxin1 (PT-1) sequence, or a GpTx-1 sequence, a MOKA Toxin sequence, a OSK1 (P12, K16, D20) sequence, a OSK1 (K16, D20) sequence, a HmK sequence, a ShK (K16,Y26, K29) sequence, a ShK (K16) sequence, a ShK-A (K16) sequence, a ShK (K16,E30) sequence, a ShK (Q21) sequence, a ShK (L21) sequence, a ShK (F21) sequence, a ShK (121) sequence, or a ShK (A21) sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is any one of SEQ ID NOS: 475-481, 599-655, 666-698, 727-733, 808-810 and 831-835.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a CX¹X²X³X⁴X⁵motif.

In some embodiments of each or any of the above or below mentioned embodiments, the (X^aX^b)_zmotif is YXYXYX.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵X_nmotif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q), and wherein n is 27-54.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵X_n(X^aX^b)_zmotif, wherein X₁is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X₂is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X₃is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X₄is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), wherein X₅is glutamine (Q), X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), wherein n is 27-54, and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a CX¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q), a cysteine motif selected from the group consisting of: CX₁₀CX₅CX₅CXCX₇C (SEQ ID NO: 41), CX₁₀CX₆CX₅CXCX₁₅C (SEQ ID NO: 42), CX₁₁CXCX₅C (SEQ ID NO: 43), CX₁₁CX₅CX₅CXCX₇C (SEQ ID NO: 44), CX₁₀CX₆CX₅CXCX₁₃C (SEQ ID NO: 45), CX₁₀CX₅CXCX₄CX₅C (SEQ ID NO: 46), CX₁₀CX₆CX₆CXCX₇C (SEQ ID NO: 47), CX₁₀CX₄CX₇CXCX₅C (SEQ ID NO: 48), CX₁₀CX₄CX₇CXCX₇C (SEQ ID NO: 49), CX₁₃CX₈CX₈C (SEQ ID NO: 50), CX₁₀CX₆CX₅CXCX₇C (SEQ ID NO: 51), CX₁₀CX₅CX₅C (SEQ ID NO: 52), CX₁₀CX₅CX₆CXCX₇C (SEQ ID NO: 53), CX₁₀CX₆CX₅CX₇CX₉C (SEQ ID NO: 54), CX₉CX₇CXCXCX₇C (SEQ ID NO: 55), CX₁₀CX₆CX₅CXCX₉C (SEQ ID NO: 56), CX₁₀CXCX₄CX₅CX₁₁C (SEQ ID NO: 57), CX₇CX₃CX₆CX₅CXCX₅CX₁₀C (SEQ ID NO: 58), CX₁₀CXCX₄CX₅CXCX₂CX₃C (SEQ ID NO: 59), CX₁₆CX₅CXC (SEQ ID NO: 60), CX₆CX₄CXCX₄CX₅C (SEQ ID NO: 61), CX₁₁CX₄CX₅CX₆CX₃C (SEQ ID NO: 62), CX₈CX₂CX₆CX₅C (SEQ ID NO: 63), CX₁₀CX₅CX₅CXCX₁₀C (SEQ ID NO: 64), CX₁₀CXCX₆CX₄CXC (SEQ ID NO: 65), CX₁₀CX₅CX₅CXCX₂C (SEQ ID NO: 66), CX₁₄CX₂CX₃CXCXC (SEQ ID NO: 67), CX₁₅CX₅CXC (SEQ ID NO: 68), CX₄CX₆CX₉CX₂CX₁₁C (SEQ ID NO: 69), CX₆CX₄CX₅CX₅CX₁₂C (SEQ ID NO: 70), CX₇CX₃CXCXCX₄CX₅CX₉C (SEQ ID NO: 71), CX₁₀CX₆CX₅C (SEQ ID NO: 72), CX₇CX₃CXCX₅CX₉C (SEQ ID NO: 73), CX₇CX₅CXCX₂C (SEQ ID NO: 74), CX₁₀CXCX₆C (SEQ ID NO: 75), CX₁₀CX₃CX₃CX₅CX₇CXCX₆C (SEQ ID NO: 76), CX₁₀CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 77), CX₁₂CX₄CX₅CXCXCX₉CX₃C (SEQ ID NO: 78), CX₁₂CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 79), CX₁₀CX₆CX₅CXCX₁₁C (SEQ ID NO: 80), CX₁₆CX₅CXCXCX₁₄C (SEQ ID NO: 81), CX₁₀CX₅CXCX₈CX₆C (SEQ ID NO: 82), CX₁₂CX₄CX₅CX₈CX₂C (SEQ ID NO: 83), CX₁₂CX₅CX₅CXCX₈C (SEQ ID NO: 84), CX₁₀CX₆CX₅CXCX₄CXCX₉C (SEQ ID NO: 85), CX₁₁CX₄CX₅CX₈CX₂C (SEQ ID NO: 86), CX₁₀CX₆CX₅CX₈CX₂C (SEQ ID NO: 87), CX₁₀CX₆CX₅CXCX₈C (SEQ ID NO: 88), CX₁₀CX₆CX₅CXCX₃CX₈CX₂C (SEQ ID NO: 89), CX₁₀CX₆CX₅CX₃CX₈C (SEQ ID NO: 90), CX₁₀CX₆CX₅CXCX₂CX₆CX₅C (SEQ ID NO: 91), CX₇CX₆CX₃CX₃CX₉C (SEQ ID NO: 92), CX₉CX₈CX₅CX₆CX₅C (SEQ ID NO: 93), CX₁₀CX₂CX₂CX₇CXCX₁₁CX₅C (SEQ ID NO: 94), and CX₁₀CX₆CX₅CXCX₂CX₈CX₄C (SEQ ID NO: 95); and a (X^aX^b)_zmotif, X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a CX¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q); a cysteine motif selected from the group consisting of: wherein the cysteine motif is selected from the group consisting of: CCX₃CXCX₃CX₂CCXCX₅CX₉CX₅CXC (SEQ ID NO: 96), CX₆CX₂CX₅CX₄CCXCX₄CX₆CXC (SEQ ID NO: 97), CX₇CXCX₅CX₄CCCX₄CX₆CXC (SEQ ID NO: 98), CX₉CX₃CXCX₂CXCCCX₆CX₄C (SEQ ID NO: 99), CX₅CX₃CXCX₄CX₄CCX₁₀CX₂CC (SEQ ID NO: 100), CX₅CXCX₁CXCX₃CCX₃CX₄CX₁₀C (SEQ ID NO: 101), CX₉CCCX₃CX₄CCCX₅CX₆C (SEQ ID NO: 102), CCX₈CX₅CX₄CX₃CX₄CCXCX₁C (SEQ ID NO: 103), CCX₆CCX₅CCCX₄CX₄CX₁₂C (SEQ ID NO: 104), CX₆CX₂CX₃CCCX₄CX₅CX₃CX₃C (SEQ ID NO: 105), CX₃CX₅CX₆CX₄CCXCX₅CX₄CXC (SEQ ID NO: 106), CX₄CX₄CCX₄CX₄CXCX₁₁CX₂CXC (SEQ ID NO: 107), CX₅CX₂CCX₅CX₄CCX₃CCX₇C (SEQ ID NO: 108), CX₅CX₅CX₃CX₂CXCCX₄CX₇CXC (SEQ ID NO: 109), CX₃CX₇CX₃CX₄CCXCX₂CX₅CX₂C (SEQ ID NO: 110), CX₉CX₃CXCX₄CCX₅CCCX₆C (SEQ ID NO: 111), CX₉CX₃CXCX₂CXCCX₆CX₃CX₃C (SEQ ID NO: 112), CX₈CCXCX₃CCX₃CXCX₃CX₄C (SEQ ID NO: 113), CX₉CCX₄CX₂CXCCXCX₄CX₃C (SEQ ID NO: 114), CX₁₀CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 115), CX₉CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 116), CX₆CCXCX₅CX₄CCXCX₅CX₂C (SEQ ID NO: 117), CX₆CCXCX₃CXCCX₃CX₄CC (SEQ ID NO: 118), CX₆CCXCX₃CXCX₂CXCX₄CX₈C (SEQ ID NO: 119), CX₄CX₂CCX₃CXCX₄CCX₂CX₃C (SEQ ID NO: 120), CX₃CX₅CX₃CCCX₄CX₉C (SEQ ID NO: 121), CCX₉CX₃CXCCX₃CX₅C (SEQ ID NO: 122), CX₉CX₂CX₃CX₄CCX₄CX₅C (SEQ ID NO: 123), CX₉CX₇CX₄CCXCX₇CX₃C (SEQ ID NO: 124), CX₉CX₃CCCX₁₀CX₂CX₃C (SEQ ID NO: 125), CX₃CX₅CX₅CX₄CCX₁₀CX₆C (SEQ ID NO: 126), CX₉CX₅CX₄CCXCX₅CX₄C (SEQ ID NO: 127), CX₇CXCX₆CX₄CCCX₁₀C (SEQ ID NO: 128), CX₈CX₂CX₄CCX₄CX₃CX₃C (SEQ ID NO: 129), CX₇CX₅CXCX₄CCX₇CX₄C (SEQ ID NO: 130), CX₁₁CX₃CX₄CCCX₈CX₂C (SEQ ID NO: 131), CX₂CX₃CX₄CCX₄CX₅CX₁₅C (SEQ ID NO: 132), CX₉CX₅CX₄CCX₇C (SEQ ID NO: 133), CX₉CX₇CX₃CX₂CX₆C (SEQ ID NO: 134), CX₉CX₅CX₄CCX₁₄C (SEQ ID NO: 135), CX₉CX₅CX₄CCX₈C (SEQ ID NO: 136), CX₉CX₆CX₄CCXC (SEQ ID NO: 137), CX₅CCX₇CX₄CX₁₂(SEQ ID NO: 138), CX₁₀CX₃CX₄CCX₄C (SEQ ID NO: 139), CX₉CX₄CCX₅CX₄C (SEQ ID NO: 140), CX₁₀CX₃CX₄CX₇CXC (SEQ ID NO: 141), CX₇CX₇CX₂CX₂CX₃C (SEQ ID NO: 142), CX₉CX₄CX₄CCX₆C (SEQ ID NO: 143), CX₇CXCX₃CXCX₆C (SEQ ID NO: 144), CX₇CXCX₄CXCX₄C (SEQ ID NO: 145), CX₉CX₅CX₄C (SEQ ID NO: 146), CX₃CX₆CX₈C (SEQ ID NO: 147), CX₁₀CXCX₄C (SEQ ID NO: 148), CX₁₀CCX₄C (SEQ ID NO: 149), CX₁₅C (SEQ ID NO: 150), CX₁₀C (SEQ ID NO: 151), and CX₉C (SEQ ID NO: 152); and ba (X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.