HUMANIZED ANTIBODIES

FIELD

The present disclosure relates to humanized antibodies, including antibodies comprising an ultralong CDR3.

BACKGROUND

Antibodies are natural proteins that the vertebrate immune system forms in response to foreign substances (antigens), primarily for defense against infection. For over a century, antibodies have been induced in animals under artificial conditions and harvested for use in therapy or diagnosis of disease conditions, or for biological research. Each individual antibody producing cell produces a single type of antibody with a chemically defined composition, however, antibodies obtained directly from animal serum in response to antigen inoculation actually comprise an ensemble of non-identical molecules (e.g., polyclonal antibodies) made from an ensemble of individual antibody producing cells.

Some bovine antibodies have unusually long VH CDR3 sequences compared to other vertebrates. For example, about 10% of IgM contains “ultralong” CDR3 sequences, which can be up to 61 amino acids long. These unusual CDR3s often have multiple cysteines. Functional VH genes form through a process called V(D)J recombination, wherein the D-region encodes a significant proportion of CDR3. A unique D-region encoding an ultralong sequence has been identified in cattle. Ultralong CDR3s are partially encoded in the cattle genome, and provide a unique characteristic of their antibody repertoire in comparison to humans. Kaushik et al. (U.S. Pat. Nos. 6,740,747 and 7,196,185) disclose several bovine germline D-gene sequences unique to cattle stated to be useful as probes and a bovine VDJ cassette stated to be useful as a vaccine vector.

SUMMARY

The present disclosure provides humanized antibodies, including antibodies comprising an ultralong CDR3, methods of making same, and uses thereof.

The present disclosure provides a humanized antibody or binding fragment thereof comprising an ultralong CDR3.

In some embodiments, the humanized antibody or binding fragment thereof comprises one or more human variable region framework sequences.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 is 35 amino acids in length or longer, 40 amino acids in length or longer, 45 amino acids in length or longer, 50 amino acids in length or longer, 55 amino acids in length or longer, or 60 amino acids in length or longer.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 is 35 amino acids in length or longer.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 3 or more cysteine residues, 4 or more cysteine residues, 5 or more cysteine residues, 6 or more cysteine residues, 7 or more cysteine residues, 8 or more cysteine residues, 9 or more cysteine residues, 10 or more cysteine residues, 11 or more cysteine residues, or 12 or more cysteine residues.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 3 or more cysteine residues.

In some embodiments of each or any of the above or below mentioned embodiments, the antibodies or binding fragments thereof comprise a cysteine motif.

In some embodiments of each or any of the above or below mentioned embodiments, the cysteine motif is selected from the group consisting of:

(SEQ ID NO: 41)

CX₁₀CX₅CX₅CXCX₇C,

(SEQ ID NO: 42)

CX₁₀CX₆CX₅CXCX₁₅C,

(SEQ ID NO: 43)

CX₁₁CXCX₅C,

(SEQ ID NO: 44)

CX₁₁CX₅CX₅CXCX₇C,

(SEQ ID NO: 45)

CX₁₀CX₆CX₅CXCX₁₃C,

(SEQ ID NO: 46)

CX₁₀CX₅CXCX₄CX₈C,

(SEQ ID NO: 47)

CX₁₀CX₆CX₆CXCX₇C,

(SEQ ID NO: 48)

CX₁₀CX₄CX₇CXCX₈C,

(SEQ ID NO: 49)

CX₁₀CX₄CX₇CXCX₇C,

(SEQ ID NO: 50)

CX₁₃CX₈CX₈C,

(SEQ ID NO: 51)

CX₁₀CX₆CX₅CXCX₇C,

(SEQ ID NO: 52)

CX₁₀CX₅CX₅C,

(SEQ ID NO: 53)

CX₁₀CX₅CX₆CXCX₇C,

(SEQ ID NO: 54)

CX₁₀CX₆CX₅CX₇CX₈C,

(SEQ ID NO: 55)

CX₉CX₇CX₅CXCX₇C,

(SEQ ID NO: 56)

CX₁₀CX₆CX₅CXCX₈C,

(SEQ ID NO: 57)

CX₁₀CXCX₄CX₅CX₁₁C,

(SEQ ID NO: 58)

CX₇CX₃CX₆CX₅CXCX₅CX₁₀C,

(SEQ ID NO: 59)

CX₁₀CXCX₄CX₅CXCX₂CX₃C,

(SEQ ID NO: 60)

CX₁₆CX₅CXC,

(SEQ ID NO: 61)

CX₆CX₄CXCX₄CX₅C,

(SEQ ID NO: 62)

CX₁₁CX₄CX₅CX₆CX₃C,

(SEQ ID NO: 63)

CX₈CX₂CX₆CX₅C,

(SEQ ID NO: 64)

CX₁₀CX₅CX₅CXCX₁₀C,

(SEQ ID NO: 65)

CX₁₀CXCX₆CX₄CXC,

(SEQ ID NO: 66)

CX₁₀CX₅CX₅CXCX₂C,

(SEQ ID NO: 67)

CX₁₄CX₂CX₃CXCXC,

(SEQ ID NO: 68)

CX₁₅CX₅CXC,

(SEQ ID NO: 69)

CX₄CX₆CX₈CX₂CX₁₁C,

(SEQ ID NO: 70)

CX₆CX₄CX₅CX₅CX₁₂C,

(SEQ ID NO: 71)

CX₇CX₃CXCXCX₄CX₅CX₉C,

(SEQ ID NO: 72)

CX₁₀CX₆CX₅C,

(SEQ ID NO: 73)

CX₇CX₃CX₅CX₅CX₉C,

(SEQ ID NO: 74)

CX₇CX₅CXCX₂C,

(SEQ ID NO: 75)

CX₁₀CXCX₆C,

(SEQ ID NO: 76)

CX₁₀CX₃CX₃CX₅CX₇CXCX₆C,

(SEQ ID NO: 77)

CX₁₀CX₄CX₅CX₁₂CX₂C,

(SEQ ID NO: 78)

CX₁₂CX₄CX₅CXCXCX₉CX₃C,

(SEQ ID NO: 79)

CX₁₂CX₄CX₅CX₁₂CX₂C,

(SEQ ID NO: 80)

CX₁₀CX₆CX₅CXCX₁₁C,

(SEQ ID NO: 81)

CX₁₆CX₅CXCXCX₁₄C,

(SEQ ID NO: 82)

CX₁₀CX₅CXCX₈CX₆C,

(SEQ ID NO: 83)

CX₁₂CX₄CX₅CX₈CX₂C,

(SEQ ID NO: 84)

CX₁₂CX₅CX₅CXCX₈C,

(SEQ ID NO: 85)

CX₁₀CX₆CX₅CXCX₄CXCX₉C,

(SEQ ID NO: 86)

CX₁₁CX₄CX₅CX₈CX₂C,

(SEQ ID NO: 87)

CX₁₀CX₆CX₅CX₈CX₂C,

(SEQ ID NO: 88)

CX₁₀CX₆CX₅CXCX₈C,

(SEQ ID NO: 89)

CX₁₀CX₆CX₅CXCX₃CX₈CX₂C,

(SEQ ID NO: 90)

CX₁₀CX₆CX₅CX₃CX₈C,

(SEQ ID NO: 91)

CX₁₀CX₆CX₅CXCX₂CX₆CX₅C,

(SEQ ID NO: 92)

CX₇CX₆CX₃CX₃CX₉C,

(SEQ ID NO: 93)

CX₉CX₈CX₅CX₆CX₅C,

(SEQ ID NO: 94)

CX₁₀CX₂CX₂CX₇CXCX₁₁CX₅C,

and

(SEQ ID NO: 95)

CX₁₀CX₆CX₅CXCX₂CX₈CX₄C.

In some embodiments of each or any of the above or below mentioned embodiments, the cysteine motif is selected from the group consisting of:

(SEQ ID NO: 96)

CCX₃CXCX₃CX₂CCXCX₅CX₉CX₅CXC,

(SEQ ID NO: 97)

CX₆CX₂CX₅CX₄CCXCX₄CX₆CXC,

(SEQ ID NO: 98)

CX₇CXCX₅CX₄CCCX₄CX₆CXC,

(SEQ ID NO: 99)

CX₉CX₃CXCX₂CXCCCX₆CX₄C,

(SEQ ID NO: 100)

CX₅CX₃CXCX₄CX₄CCX₁₀CX₂CC,

(SEQ ID NO: 101)

CX₅CXCX₁CXCX₃CCX₃CX₄CX₁₀C,

(SEQ ID NO: 102)

CX₉CCCX₃CX₄CCCX₅CX₆C,

(SEQ ID NO: 103)

CCX₈CX₅CX₄CX₃CX₄CCXCX₁C,

(SEQ ID NO: 104)

CCX₆CCX₅CCCX₄CX₄CX₁₂C,

(SEQ ID NO: 105)

CX₆CX₂CX₃CCCX₄CX₅CX₃CX₃C,

(SEQ ID NO: 106)

CX₃CX₅CX₆CX₄CCXCX₅CX₄CXC,

(SEQ ID NO: 107)

CX₄CX₄CCX₄CX₄CXCX₁₁CX₂CXC,

(SEQ ID NO: 108)

CX₅CX₂CCX₅CX₄CCX₃CCX₇C,

(SEQ ID NO: 109)

CX₅CX₅CX₃CX₂CXCCX₄CX₇CXC,

(SEQ ID NO: 110)

CX₃CX₇CX₃CX₄CCXCX₂CX₅CX₂C,

(SEQ ID NO: 111)

CX₉CX₃CXCX₄CCX₅CCCX₆C,

(SEQ ID NO: 112)

CX₉CX₃CXCX₂CXCCX₆CX₃CX₃C,

(SEQ ID NO: 113)

CX₈CCXCX₃CCX₃CXCX₃CX₄C,

(SEQ ID NO: 114)

CX₉CCX₄CX₂CXCCXCX₄CX₃C,

(SEQ ID NO: 115)

CX₁₀CXCX₃CX₂CXCCX₄CX₅CXC,

(SEQ ID NO: 116)

CX₉CXCX₃CX₂CXCCX₄CX₅CXC,

(SEQ ID NO: 117)

CX₆CCXCX₅CX₄CCXCX₅CX₂C,

(SEQ ID NO: 118)

CX₆CCXCX₃CXCCX₃CX₄CC,

(SEQ ID NO: 119)

CX₆CCXCX₃CXCX₂CXCX₄CX₈C,

(SEQ ID NO: 120)

CX₄CX₂CCX₃CXCX₄CCX₂CX₃C,

(SEQ ID NO: 121)

CX₃CX₅CX₃CCCX₄CX₉C,

(SEQ ID NO: 122)

CCX₉CX₃CXCCX₃CX₅C,

(SEQ ID NO: 123)

CX₉CX₂CX₃CX₄CCX₄CX₅C,

(SEQ ID NO: 124)

CX₉CX₇CX₄CCXCX₇CX₃C,

(SEQ ID NO: 125)

CX₉CX₃CCCX₁₀CX₂CX₃C,

(SEQ ID NO: 126)

CX₃CX₅CX₅CX₄CCX₁₀CX₆C,

(SEQ ID NO: 127)

CX₉CX₅CX₄CCXCX₅CX₄C,

(SEQ ID NO: 128)

CX₇CXCX₆CX₄CCCX₁₀C,

(SEQ ID NO: 129)

CX₈CX₂CX₄CCX₄CX₃CX₃C,

(SEQ ID NO: 130)

CX₇CX₅CXCX₄CCX₇CX₄C,

(SEQ ID NO: 131)

CX₁₁CX₃CX₄CCCX₉CX₂C,

(SEQ ID NO: 132)

CX₂CX₃CX₄CCX₄CX₅CX₁₅C,

(SEQ ID NO: 133)

CX₉CX₅CX₄CCX₇C,

(SEQ ID NO: 134)

CX₉CX₇CX₃CX₂CX₆C,

(SEQ ID NO: 135)

CX₉CX₅CX₄CCX₁₄C,

(SEQ ID NO: 136)

CX₉CX₅CX₄CCX₉C,

(SEQ ID NO: 137)

CX₉CX₆CX₄CCXC,

(SEQ ID NO: 138)

CX₅CCX₇CX₄CX₁₂,

(SEQ ID NO: 139)

CX₁₀CX₃CX₄CCX₄C,

(SEQ ID NO: 140)

CX₉CX₄CCX₅CX₄C,

(SEQ ID NO: 141)

CX₁₀CX₃CX₄CX₇CXC,

(SEQ ID NO: 142)

CX₇CX₇CX₂CX₂CX₃C,

(SEQ ID NO: 143)

CX₉CX₄CX₄CCX₆C,

(SEQ ID NO: 144)

CX₇CXCX₃CXCX₆C,

(SEQ ID NO: 145)

CX₇CXCX₄CXCX₄C,

(SEQ ID NO: 146)

CX₉CX₅CX₄C,

(SEQ ID NO: 147)

CX₃CX₆CX₉C,

(SEQ ID NO: 148)

CX₁₀CXCX₄C,

(SEQ ID NO: 149)

CX₁₀CCX₄C,

(SEQ ID NO: 150)

CX₁₅C,

(SEQ ID NO: 151)

CX₁₀C,

and

(SEQ ID NO: 152)

CX₉C.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 2 to 6 disulfide bonds.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises SEQ ID NO: 40 or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises amino acid residues 3-6 of any of one SEQ ID NO: 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a non-human DH or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the non-human DH is SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, or SEQ ID NO: 12.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a JH sequence or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the JH sequence is SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, or SEQ ID NO: 17.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a non-human or human VH sequence (e.g., a germline VH) or a derivative thereof; a non-human DH sequence or a derivative thereof; and/or JH sequence or derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises an additional amino acid sequence comprising two to six amino acid residues or more positioned between the VH sequence and the DH sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the additional amino acid sequence is selected from the group consisting of: IR, IF, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 or SEQ ID NO: 21.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a sequence derived from or based on SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, or SEQ ID NO: 28.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a bovine sequence, a non-bovine sequence, an antibody sequence, or a non-antibody sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is a synthetic sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is a cytokine sequence, a lymphokine sequence, a chemokine sequence, a growth factor sequence, a hormone sequence, or a toxin sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is an IL-8 sequence, an IL-21 sequence, an SDF-1 (alpha) sequence, a somatostatin sequence, a chlorotoxin sequence, a Pro-TxII sequence, or a ziconotide sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is any one of SEQ ID NOS: 475-481.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence replaces at least a portion of the ultralong CDR3.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q).

In some embodiments of each or any of the above or below mentioned embodiments, the X¹X²X³X⁴X⁵motif is TTVHQ (SEQ ID NO: 153), TSVHQ (SEQ ID NO: 154), SSVTQ (SEQ ID NO: 155), STVHQ (SEQ ID NO: 156), ATVRQ (SEQ ID NO: 157), TTVYQ (SEQ ID NO: 158), SPVHQ (SEQ ID NO: 159), ATVYQ (SEQ ID NO: 160), TAVYQ (SEQ ID NO: 161), TNVHQ (SEQ ID NO: 162), ATVHQ (SEQ ID NO: 163), STVYQ (SEQ ID NO: 164), TIVHQ (SEQ ID NO: 165), AIVYQ (SEQ ID NO: 166), TTVFQ (SEQ ID NO: 167), AAVFQ (SEQ ID NO: 168), GTVHQ (SEQ ID NO: 169), ASVHQ (SEQ ID NO: 170), TAVFQ (SEQ ID NO: 171), ATVFQ (SEQ ID NO: 172), AAAHQ (SEQ ID NO: 173), VVVYQ (SEQ ID NO: 174), GTVFQ (SEQ ID NO: 175), TAVHQ (SEQ ID NO: 176), ITVHQ (SEQ ID NO: 177), ITAHQ (SEQ ID NO: 178), VTVHQ (SEQ ID NO: 179); AAVHQ (SEQ ID NO: 180), GTVYQ (SEQ ID NO: 181), TTVLQ (SEQ ID NO: 182), TTTHQ (SEQ ID NO: 183), or TTDYQ (SEQ ID NO: 184).

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a CX¹X²X³X⁴X⁵motif.

In some embodiments of each or any of the above or below mentioned embodiments, the CX¹X²X³X⁴X⁵motif is CTTVHQ (SEQ ID NO: 185), CTSVHQ (SEQ ID NO: 186), CSSVTQ (SEQ ID NO: 187), CSTVHQ (SEQ ID NO: 188), CATVRQ (SEQ ID NO: 189), CTTVYQ (SEQ ID NO: 190), CSPVHQ (SEQ ID NO: 191), CATVYQ (SEQ ID NO: 192), CTAVYQ (SEQ ID NO: 193), CTNVHQ (SEQ ID NO: 194), CATVHQ (SEQ ID NO: 195), CSTVYQ (SEQ ID NO: 196), CTIVHQ (SEQ ID NO: 197), CAIVYQ (SEQ ID NO: 198), CTTVFQ (SEQ ID NO: 199), CAAVFQ (SEQ ID NO: 200), CGTVHQ (SEQ ID NO: 201), CASVHQ (SEQ ID NO: 202), CTAVFQ (SEQ ID NO: 203), CATVFQ (SEQ ID NO: 204), CAAAHQ (SEQ ID NO: 205), CVVVYQ (SEQ ID NO: 206), CGTVFQ (SEQ ID NO: 207), CTAVHQ (SEQ ID NO: 208), CITVHQ (SEQ ID NO: 209), CITAHQ (SEQ ID NO: 210), CVTVHQ (SEQ ID NO: 211); CAAVHQ (SEQ ID NO: 212), CGTVYQ (SEQ ID NO: 213), CTTVLQ (SEQ ID NO: 214), CTTTHQ (SEQ ID NO: 215), or CTTDYQ (SEQ ID NO: 216).

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a (X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the (X^aX^b)_zmotif is CYTYNYEF (SEQ ID NO: 217), HYTYTYDF (SEQ ID NO: 218), HYTYTYEW (SEQ ID NO: 219), KHRYTYEW (SEQ ID NO: 220), NYIYKYSF (SEQ ID NO: 221), PYIYTYQF (SEQ ID NO: 222), SFTYTYEW (SEQ ID NO: 223), SYIYIYQW (SEQ ID NO: 224), SYNYTYSW (SEQ ID NO: 225), SYSYSYEY (SEQ ID NO: 226), SYTYNYDF (SEQ ID NO: 227), SYTYNYEW (SEQ ID NO: 228), SYTYNYQF (SEQ ID NO: 229), SYVWTHNF (SEQ ID NO: 230), TYKYVYEW (SEQ ID NO: 231), TYTYTYEF (SEQ ID NO: 232), TYTYTYEW (SEQ ID NO: 233), VFTYTYEF (SEQ ID NO: 234), AYTYEW (SEQ ID NO: 235), DYIYTY (SEQ ID NO: 236), IHSYEF (SEQ ID NO: 237), SFTYEF (SEQ ID NO: 238), SHSYEF (SEQ ID NO: 239), THTYEF (SEQ ID NO: 240), TWTYEF (SEQ ID NO: 241), TYNYEW (SEQ ID NO: 242), TYSYEF (SEQ ID NO: 243), TYSYEH (SEQ ID NO: 244), TYTYDF (SEQ ID NO: 245), TYTYEF (SEQ ID NO: 246), TYTYEW (SEQ ID NO: 247), AYEF (SEQ ID NO: 248), AYSF (SEQ ID NO: 249), AYSY (SEQ ID NO: 250), CYSF (SEQ ID NO: 251), DYTY (SEQ ID NO: 252), KYEH (SEQ ID NO: 253), KYEW (SEQ ID NO: 254), MYEF (SEQ ID NO: 255), NWIY (SEQ ID NO: 256), NYDY (SEQ ID NO: 257), NYQW (SEQ ID NO: 258), NYSF (SEQ ID NO: 259), PYEW (SEQ ID NO: 260), RYNW (SEQ ID NO: 261), RYTY (SEQ ID NO: 262), SYEF (SEQ ID NO: 263), SYEH (SEQ ID NO: 264), SYEW (SEQ ID NO: 265), SYKW (SEQ ID NO: 266), SYTY (SEQ ID NO: 267), TYDF (SEQ ID NO: 268), TYEF (SEQ ID NO: 269), TYEW (SEQ ID NO: 270), TYQW (SEQ ID NO: 271), TYTY (SEQ ID NO: 272), or VYEW (SEQ ID NO: 273).

In some embodiments of each or any of the above or below mentioned embodiments, the (X^aX^b)_zmotif is YXYXYX.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵X_nmotif, wherein X₁is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X₂is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X₃is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X₄is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), wherein X₅is glutamine (Q), and wherein n is 27-54.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises X_n(X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), wherein n is 27-54, and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵X_n(X^aX^b)_zmotif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q), wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), wherein n is 27-54, and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the X¹X²X³X⁴X⁵motif is TTVHQ (SEQ ID NO: 153) or TSVHQ (SEQ ID NO: 154), and wherein the (X^aX^b)_zmotif is YXYXYX.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a CX¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q); a cysteine motif selected from the group consisting of: CX₁₀CX₅CX₅CXCX₇C (SEQ ID NO: 41), CX₁₀CX₆CX₅CXCX₁₅C (SEQ ID NO: 42), CX₁₁CXCX₅C (SEQ ID NO: 43), CX₁₁CX₅CX₅CXCX₇C (SEQ ID NO: 44), CX₁₀CX₆CX₅CXCX₁₃C (SEQ ID NO: 45), CX₁₀CX₅CXCX₄CX₈C (SEQ ID NO: 46), CX₁₀CX₆CX₆CXCX₇C (SEQ ID NO: 47), CX₁₀CX₄CX₇CXCX₈C (SEQ ID NO: 48), CX₁₀CX₄CX₇CXCX₇C (SEQ ID NO: 49), CX₁₃CX₈CX₈C (SEQ ID NO: 50), CX₁₀CX₆CX₅CXCX₇C (SEQ ID NO: 51), CX₁₀CX₅CX₅C (SEQ ID NO: 52), CX₁₀CX₅CX₆CXCX₇C (SEQ ID NO: 53), CX₁₀CX₆CX₅CX₇CX₉C (SEQ ID NO: 54), CX₉CX₇CX₅CXCX₇C (SEQ ID NO: 55), CX₁₀CX₆CX₅CXCX₉C (SEQ ID NO: 56), CX₁₀CXCX₄CX₅CX₁₁C (SEQ ID NO: 57), CX₇CX₃CX₆CX₅CXCX₅CX₁₀C (SEQ ID NO: 58), CX₁₀CXCX₄CX₅CXCX₂CX₃C (SEQ ID NO: 59), CX₁₆CX₅CXC (SEQ ID NO: 60), CX₆CX₄CXCX₄CX₅C (SEQ ID NO: 61), CX₁₁CX₄CX₅CX₆CX₃C (SEQ ID NO: 62), CX₈CX₂CX₆CX₅C (SEQ ID NO: 63), CX₁₀CX₅CX₅CXCX₁₀C (SEQ ID NO: 64), CX₁₀CXCX₆CX₄CXC (SEQ ID NO: 65), CX₁₀CX₅CX₅CXCX₂C (SEQ ID NO: 66), CX₁₄CX₂CX₃CXCXC (SEQ ID NO: 67), CX₁₅CX₅CXC (SEQ ID NO: 68), CX₄CX₆CX₉CX₂CX₁₁C (SEQ ID NO: 69), CX₆CX₄CX₅CX₅CX₁₂C (SEQ ID NO: 70), CX₇CX₃CXCXCX₄CX₅CX₉C (SEQ ID NO: 71), CX₁₀CX₆CX₅C (SEQ ID NO: 72), CX₇CX₃CX₅CX₅CX₉C (SEQ ID NO: 73), CX₇CX₅CXCX₂C (SEQ ID NO: 74), CX₁₀CXCX₆C (SEQ ID NO: 75), CX₁₀CX₃CX₃CX₅CX₇CXCX₆C (SEQ ID NO: 76), CX₁₀CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 77), CX₁₂CX₄CX₅CXCXCX₉CX₃C (SEQ ID NO: 78), CX₁₂CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 79), CX₁₀CX₆CX₅CXCX₁₁C (SEQ ID NO: 80), CX₁₆CX₅CXCXCX₁₄C (SEQ ID NO: 81), CX₁₀CX₅CXCX₈CX₆C (SEQ ID NO: 82), CX₁₂CX₄CX₅CX₈CX₂C (SEQ ID NO: 83), CX₁₂CX₅CX₅CXCX₈C (SEQ ID NO: 84), CX₁₀CX₆CX₅CXCX₄CXCX₉C (SEQ ID NO: 85), CX₁₁CX₄CX₅CX₈CX₂C (SEQ ID NO: 86), CX₁₀CX₆CX₅CX₈CX₂C (SEQ ID NO: 87), CX₁₀CX₆CX₅CXCX₈C (SEQ ID NO: 88), CX₁₀CX₆CX₅CXCX₃CX₈CX₂C (SEQ ID NO: 89), CX₁₀CX₆CX₅CX₃CX₈C (SEQ ID NO: 90), CX₁₀CX₆CX₅CXCX₂CX₆CX₅C (SEQ ID NO: 91), CX₇CX₆CX₃CX₃CX₉C (SEQ ID NO: 92), CX₉CX₈CX₅CX₆CX₅C (SEQ ID NO: 93), CX₁₀CX₂CX₂CX₇CXCX₁₁CX₅C (SEQ ID NO: 94), and CX₁₀CX₆CX₅CXCX₂CX₈CX₄C (SEQ ID NO: 95), and a (X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a CX¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q); a cysteine motif selected from the group consisting of: wherein the cysteine motif is selected from the group consisting of: CCX₃CXCX₃CX₂CCXCX₅CX₉CX₅CXC (SEQ ID NO: 96), CX₆CX₂CX₅CX₄CCXCX₄CX₆CXC (SEQ ID NO: 97), CX₇CXCX₅CX₄CCCX₄CX₆CXC (SEQ ID NO: 98), CX₉CX₃CXCX₂CXCCCX₆CX₄C (SEQ ID NO: 99), CX₅CX₃CXCX₄CX₄CCX₁₀CX₂CC (SEQ ID NO: 100), CX₅CXCX₁CXCX₃CCX₃CX₄CX₁₀C (SEQ ID NO: 101), CX₉CCCX₃CX₄CCCX₅CX₆C (SEQ ID NO: 102), CCX₈CX₅CX₄CX₃CX₄CCXCX₁C (SEQ ID NO: 103), CCX₆CCX₅CCCX₄CX₄CX₁₂C (SEQ ID NO: 104), CX₆CX₂CX₃CCCX₄CX₅CX₃CX₃C (SEQ ID NO: 105), CX₃CX₅CX₆CX₄CCXCX₅CX₄CXC (SEQ ID NO: 106), CX₄CX₄CCX₄CX₄CXCX₁₁CX₂CXC (SEQ ID NO: 107), CX₅CX₂CCX₅CX₄CCX₃CCX₇C (SEQ ID NO: 108), CX₅CX₅CX₃CX₂CXCCX₄CX₇CXC (SEQ ID NO: 109), CX₃CX₇CX₃CX₄CCXCX₂CX₅CX₂C (SEQ ID NO: 110), CX₉CX₃CXCX₄CCX₅CCCX₆C (SEQ ID NO: 111), CX₉CX₃CXCX₂CXCCX₆CX₃CX₃C (SEQ ID NO: 112), CX₈CCXCX₃CCX₃CXCX₃CX₄C (SEQ ID NO: 113), CX₉CCX₄CX₂CXCCXCX₄CX₃C (SEQ ID NO: 114), CX₁₀CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 115), CX₉CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 116), CX₆CCXCX₅CX₄CCXCX₅CX₂C (SEQ ID NO: 117), CX₆CCXCX₃CXCCX₃CX₄CC (SEQ ID NO: 118), CX₆CCXCX₃CXCX₂CXCX₄CX₈C (SEQ ID NO: 119), CX₄CX₂CCX₃CXCX₄CCX₂CX₃C (SEQ ID NO: 120), CX₃CX₅CX₃CCCX₄CX₉C (SEQ ID NO: 121), CCX₉CX₃CXCCX₃CX₅C (SEQ ID NO: 122), CX₉CX₂CX₃CX₄CCX₄CX₅C (SEQ ID NO: 123), CX₉CX₇CX₄CCXCX₇CX₃C (SEQ ID NO: 124), CX₉CX₃CCCX₁₀CX₂CX₃C (SEQ ID NO: 125), CX₃CX₅CX₅CX₄CCX₁₀CX₆C (SEQ ID NO: 126), CX₉CX₅CX₄CCXCX₅CX₄C (SEQ ID NO: 127), CX₇CXCX₆CX₄CCCX₁₀C (SEQ ID NO: 128), CX₈CX₂CX₄CCX₄CX₃CX₃C (SEQ ID NO: 129), CX₇CX₅CXCX₄CCX₇CX₄C (SEQ ID NO: 130), CX₁₁CX₃CX₄CCCX₈CX₂C (SEQ ID NO: 131), CX₂CX₃CX₄CCX₄CX₅CX₁₅C (SEQ ID NO: 132), CX₉CX₅CX₄CCX₇C (SEQ ID NO: 133), CX₉CX₇CX₃CX₂CX₆C (SEQ ID NO: 134), CX₉CX₅CX₄CCX₁₄C (SEQ ID NO: 135), CX₉CX₅CX₄CCX₈C (SEQ ID NO: 136), CX₉CX₆CX₄CCXC (SEQ ID NO: 137), CX₅CCX₇CX₄CX₁₂(SEQ ID NO: 138), CX₁₀CX₃CX₄CCX₄C (SEQ ID NO: 139), CX₉CX₄CCX₅CX₄C (SEQ ID NO: 140), CX₁₀CX₃CX₄CX₇CXC (SEQ ID NO: 141), CX₇CX₇CX₂CX₂CX₃C (SEQ ID NO: 142), CX₉CX₄CX₄CCX₆C (SEQ ID NO: 143), CX₇CXCX₃CXCX₆C (SEQ ID NO: 144), CX₇CXCX₄CXCX₄C (SEQ ID NO: 145), CX₉CX₅CX₄C (SEQ ID NO: 146), CX₃CX₆CX₈C (SEQ ID NO: 147), CX₁₀CXCX₄C (SEQ ID NO: 148), CX₁₀CCX₄C (SEQ ID NO: 149), CX₁₅C (SEQ ID NO: 150), CX₁₀C (SEQ ID NO: 151), and CX₉C (SEQ ID NO: 152); and a (X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises an additional sequence that is a linker.

In some embodiments of each or any of the above or below mentioned embodiments, the linker is linked to a C-terminus, a N-terminus, or both C-terminus and N-terminus of the non-antibody sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 is a ruminant CDR3.

In some embodiments of each or any of the above or below mentioned embodiments, the ruminant is a cow.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a human heavy chain variable region framework sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a human heavy chain germline sequence or is a derived from a human heavy chain germline sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a VH4-34 germline sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the VH4-34 germline sequence comprises a CDR1 comprising a Gly31Asp and Tyr32Lys substitution based on Kabat numbering.

In some embodiments of each or any of the above or below mentioned embodiments, the VH4-34 germline sequence comprises a CDR2 comprising a Glu50Ser substitution based on Kabat numbering.

In some embodiments of each or any of the above or below mentioned embodiments, the VH4-34 germline sequence comprises a CDR1 comprising Ala23Thr, Val24Ala, Tyr25Ser, Gly27Phe, Phe29Leu, Gly31Asp, Tyr32Lys, Tyr33Ala, Trp34Val, and Ser35Gly substitutions, and a CDR2 comprising Ile48Leu, Glu50Ser, Asn52Asp, His53Thr, Ser54Gly, Ser56Asn, and Asn58Gly substitutions, based on Kabat numbering.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises the amino acid sequence set forth in SEQ ID NO: 470.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises the amino acid sequence set forth in SEQ ID NO: 461, 462, 463, 464, 465, 466, 467, 468, or 469; the amino acid sequence set forth in SEQ ID NO: 470; and a peptide sequence, wherein the peptide sequence is positioned between SEQ ID NO: 461, 462, 463, 464, 465, 466, 467, 468, or 469, and SEQ ID NO: 470.

In some embodiments of each or any of the above or below mentioned embodiments, the peptide sequence is a bovine sequence, a non-bovine sequence, an antibody sequence, or a non-antibody sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a human light chain variable region framework sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprises a light chain variable region sequence that is a lambda light chain variable region sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the lambda light chain variable region sequence is a bovine lambda light chain variable region sequence or derived from a bovine lambda light chain variable region sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the lambda light chain variable region sequence is a human lambda light chain variable region sequence or derived from a human lambda light chain variable region sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the human lambda light chain variable region sequence is a VL1-51 germline sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the human lambda light chain variable region sequence is derived from a VL1-51 germline sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a CDR1 comprising Ile29Val and Asn32Gly substitution based on Kabat numbering.

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a CDR2 comprising a substitution of DNN to GDT.

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a CDR2 comprising a substitution of DNNKRP (SEQ ID NO: 471) to GDTSRA (SEQ ID NO: 472).

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a S2A, T5N, P8S, A12G, A13S, and P14L substitution based on Kabat numbering.

In some embodiments of each or any of the above or below mentioned embodiments, the VL1-51 germline sequence comprises a S2A, T5N, P8S, A12G, A13S, and P14L substitution based on Kabat numbering, and a CDR2 comprising a substitution of DNN to GDT.

In some embodiments of each or any of the above or below mentioned embodiments, the humanized antibody or binding fragment thereof comprising the amino acid sequence set forth in SEQ ID NO: 440, 441, 442, 443, or 444.

The present disclosure also provides polynucleotides encoding the humanized antibody or binding fragment thereof disclosed herein.

The present disclosure also provides polynucleotides encoding a humanized antibody or binding fragment thereof that comprises an ultralong CDR3.

The present disclosure also provides polynucleotides encoding a humanized variable region that comprises an ultralong CDR3.

The present disclosure also provides vectors that comprise the polynucleotides disclosed herein.

The present disclosure also provides host cells comprising the vectors disclosed herein.

The present disclosure also provides a nucleic acid library comprising a plurality of polynucleotides comprising sequences coding for humanized antibodies or binding fragments thereof, wherein the antibodies or binding fragments thereof comprise an ultralong CDR3.

The present disclosure also provides a library of humanized antibodies or binding fragments thereof, wherein the antibodies or binding fragments thereof comprise an ultralong CDR3.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 is 35 amino acids in length or longer.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 3 or more cysteine residues.

In some embodiments of each or any of the above or below mentioned embodiments, the antibodies or binding fragments thereof comprise a cysteine motif.

In some embodiments of each or any of the above or below mentioned embodiments, the cysteine motif is selected from the group consisting of:

(SEQ ID NO: 41)

CX₁₀CX₅CX₅CXCX₇C,

(SEQ ID NO: 42)

CX₁₀CX₆CX₅CXCX₁₅C,

(SEQ ID NO: 43)

CX₁₁CXCX₅C,

(SEQ ID NO: 44)

CX₁₁CX₅CX₅CXCX₇C,

(SEQ ID NO: 45)

CX₁₀CX₆CX₅CXCX₁₃C,

(SEQ ID NO: 46)

CX₁₀CX₅CXCX₄CX₈C,

(SEQ ID NO: 47)

CX₁₀CX₆CX₆CXCX₇C,

(SEQ ID NO: 48)

CX₁₀CX₄CX₇CXCX₈C,

(SEQ ID NO: 49)

CX₁₀CX₄CX₇CXCX₇C,

(SEQ ID NO: 50)

CX₁₃CX₈CX₈C,

(SEQ ID NO: 51)

CX₁₀CX₆CX₅CXCX₇C,

(SEQ ID NO: 52)

CX₁₀CX₅CX₅C,

(SEQ ID NO: 53)

CX₁₀CX₅CX₆CXCX₇C,

(SEQ ID NO: 54)

CX₁₀CX₆CX₅CX₇CX₉C,

(SEQ ID NO: 55)

CX₉CX₇CX₅CXCX₇C,

(SEQ ID NO: 56)

CX₁₀CX₆CX₅CXCX₉C,

(SEQ ID NO: 57)

CX₁₀CXCX₄CX₅CX₁₁C,

(SEQ ID NO: 58)

CX₇CX₃CX₆CX₅CXCX₅CX₁₀C,

(SEQ ID NO: 59)

CX₁₀CXCX₄CX₅CXCX₂CX₃C,

(SEQ ID NO: 60)

CX₁₆CX₅CXC,

(SEQ ID NO: 61)

CX₆CX₄CXCX₄CX₅C,

(SEQ ID NO: 62)

CX₁₁CX₄CX₅CX₆CX₃C,

(SEQ ID NO: 63)

CX₈CX₂CX₆CX₅C,

(SEQ ID NO: 64)

CX₁₀CX₅CX₅CXCX₁₀C,

(SEQ ID NO: 65)

CX₁₀CXCX₆CX₄CXC,

(SEQ ID NO: 66)

CX₁₀CX₅CX₅CXCX₂C,

(SEQ ID NO: 67)

CX₁₄CX₂CX₃CXCXC,

(SEQ ID NO: 68)

CX₁₅CX₅CXC,

(SEQ ID NO: 69)

CX₄CX₆CX₉CX₂CX₁₁C,

(SEQ ID NO: 70)

CX₆CX₄CX₅CX₅CX₁₂C,

(SEQ ID NO: 71)

CX₇CX₃CXCXCX₄CX₅CX₉C,

(SEQ ID NO: 72)

CX₁₀CX₆CX₅C,

(SEQ ID NO: 73)

CX₇CX₃CX₅CX₅CX₉C,

(SEQ ID NO: 74)

CX₇CX₅CXCX₂C,

(SEQ ID NO: 75)

CX₁₀CXCX₆C,

(SEQ ID NO: 76)

CX₁₀CX₃CX₃CX₅CX₇CXCX₆C,

(SEQ ID NO: 77)

CX₁₀CX₄CX₅CX₁₂CX₂C,

(SEQ ID NO: 78)

CX₁₂CX₄CX₅CXCXCX₉CX₃C,

(SEQ ID NO: 79)

CX₁₂CX₄CX₅CX₁₂CX₂C,

(SEQ ID NO: 80)

CX₁₀CX₆CX₅CXCX₁₁C,

(SEQ ID NO: 81)

CX₁₆CX₅CXCXCX₁₄C,

(SEQ ID NO: 82)

CX₁₀CX₅CXCX₈CX₆C,

(SEQ ID NO: 83)

CX₁₂CX₄CX₅CX₈CX₂C,

(SEQ ID NO: 84)

CX₁₂CX₅CX₅CXCX₈C,

(SEQ ID NO: 85)

CX₁₀CX₆CX₅CXCX₄CXCX₉C,

(SEQ ID NO: 86)

CX₁₁CX₄CX₅CX₈CX₂C,

(SEQ ID NO: 87)

CX₁₀CX₆CX₅CX₈CX₂C,

(SEQ ID NO: 88)

CX₁₀CX₆CX₅CXCX₈C,

(SEQ ID NO: 89)

CX₁₀CX₆CX₅CXCX₃CX₈CX₂C,

(SEQ ID NO: 90)

CX₁₀CX₆CX₅CX₃CX₈C,

(SEQ ID NO: 91)

CX₁₀CX₆CX₅CXCX₂CX₆CX₅C,

(SEQ ID NO: 92)

CX₇CX₆CX₃CX₃CX₉C,

(SEQ ID NO: 93)

CX₉CX₈CX₅CX₆CX₅C,

(SEQ ID NO: 94)

CX₁₀CX₂CX₂CX₇CXCX₁₁CX₅C,

and

(SEQ ID NO: 95)

CX₁₀CX₆CX₅CXCX₂CX₈CX₄C.

In some embodiments of each or any of the above or below mentioned embodiments, the cysteine motif is selected from the group consisting of:

(SEQ ID NO: 96)

CCX₃CXCX₃CX₂CCXCX₅CX₉CX₅CXC,

(SEQ ID NO: 97)

CX₆CX₂CX₅CX₄CCXCX₄CX₆CXC,

(SEQ ID NO: 98)

CX₇CXCX₅CX₄CCCX₄CX₆CXC,

(SEQ ID NO: 99)

CX₉CX₃CXCX₂CXCCCX₆CX₄C,

(SEQ ID NO: 100)

CX₅CX₃CXCX₄CX₄CCX₁₀CX₂CC,

(SEQ ID NO: 101)

CX₅CXCX₁CXCX₃CCX₃CX₄CX₁₀C,

(SEQ ID NO: 102)

CX₉CCCX₃CX₄CCCX₅CX₆C,

(SEQ ID NO: 103)

CCX₉CX₅CX₄CX₃CX₄CCXCX₁C,

(SEQ ID NO: 104)

CCX₆CCX₅CCCX₄CX₄CX₁₂C,

(SEQ ID NO: 105)

CX₆CX₂CX₃CCCX₄CX₅CX₃CX₃C,

(SEQ ID NO: 106)

CX₃CX₅CX₆CX₄CCXCX₅CX₄CXC,

(SEQ ID NO: 107)

CX₄CX₄CCX₄CX₄CXCX₁₁CX₂CXC,

(SEQ ID NO: 108)

CX₅CX₂CCX₅CX₄CCX₃CCX₇C,

(SEQ ID NO: 109)

CX₅CX₅CX₃CX₂CXCCX₄CX₇CXC,

(SEQ ID NO: 110)

CX₃CX₇CX₃CX₄CCXCX₂CX₅CX₂C,

(SEQ ID NO: 111)

CX₉CX₃CXCX₄CCX₅CCCX₆C,

(SEQ ID NO: 112)

CX₉CX₃CXCX₂CXCCX₆CX₃CX₃C,

(SEQ ID NO: 113)

CX₈CCXCX₃CCX₃CXCX₃CX₄C,

(SEQ ID NO: 114)

CX₉CCX₄CX₂CXCCXCX₄CX₃C,

(SEQ ID NO: 115)

CX₁₀CXCX₃CX₂CXCCX₄CX₅CXC,

(SEQ ID NO: 116)

CX₉CXCX₃CX₂CXCCX₄CX₅CXC,

(SEQ ID NO: 117)

CX₆CCXCX₅CX₄CCXCX₅CX₂C,

(SEQ ID NO: 118)

CX₆CCXCX₃CXCCX₃CX₄CC,

(SEQ ID NO: 119)

CX₆CCXCX₃CXCX₂CXCX₄CX₈C,

(SEQ ID NO: 120)

CX₄CX₂CCX₃CXCX₄CCX₂CX₃C,

(SEQ ID NO: 121)

CX₃CX₅CX₃CCCX₄CX₉C,

(SEQ ID NO: 122)

CCX₉CX₃CXCCX₃CX₅C,

(SEQ ID NO: 123)

CX₉CX₂CX₃CX₄CCX₄CX₅C,

(SEQ ID NO: 124)

CX₉CX₇CX₄CCXCX₇CX₃C,

(SEQ ID NO: 125)

CX₉CX₃CCCX₁₀CX₂CX₃C,

(SEQ ID NO: 126)

CX₃CX₅CX₅CX₄CCX₁₀CX₆C,

(SEQ ID NO: 127)

CX₉CX₅CX₄CCXCX₅CX₄C,

(SEQ ID NO: 128)

CX₇CXCX₆CX₄CCCX₁₀C,

(SEQ ID NO: 129)

CX₈CX₂CX₄CCX₄CX₃CX₃C,

(SEQ ID NO: 130)

CX₇CX₅CXCX₄CCX₇CX₄C,

(SEQ ID NO: 131)

CX₁₁CX₃CX₄CCCX₈CX₂C,

(SEQ ID NO: 132)

CX₂CX₃CX₄CCX₄CX₅CX₁₅C,

(SEQ ID NO: 133)

CX₉CX₅CX₄CCX₇C,

(SEQ ID NO: 134)

CX₉CX₇CX₃CX₂CX₆C,

(SEQ ID NO: 135)

CX₉CX₅CX₄CCX₁₄C,

(SEQ ID NO: 136)

CX₉CX₅CX₄CCX₈C,

(SEQ ID NO: 137)

CX₉CX₆CX₄CCXC,

(SEQ ID NO: 138)

CX₅CCX₇CX₄CX₁₂,

(SEQ ID NO: 139)

CX₁₀CX₃CX₄CCX₄C,

(SEQ ID NO: 140)

CX₉CX₄CCX₅CX₄C,

(SEQ ID NO: 141)

CX₁₀CX₃CX₄CX₇CXC,

(SEQ ID NO: 142)

CX₇CX₇CX₂CX₂CX₃C,

(SEQ ID NO: 143)

CX₉CX₄CX₄CCX₆C,

(SEQ ID NO: 144)

CX₇CXCX₃CXCX₆C,

(SEQ ID NO: 145)

CX₇CXCX₄CXCX₄C,

(SEQ ID NO: 146)

CX₉CX₅CX₄C,

(SEQ ID NO: 147)

CX₃CX₆CX₈C,

(SEQ ID NO: 148)

CX₁₀CXCX₄C,

(SEQ ID NO: 149)

CX₁₀CCX₄C,

(SEQ ID NO: 150)

CX₁₅C,

(SEQ ID NO: 151)

CX₁₀C,

and

(SEQ ID NO: 152)

CX₉C.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises 2 to 6 disulfide bonds.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises SEQ ID NO: 40 or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises amino acid residues 3-6 of any of one SEQ ID NO: 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a non-human DH or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a JH sequence or a derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the JH sequence is SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, or SEQ ID NO: 17.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a non-human VH sequence or a derivative thereof; a non-human DH sequence or a derivative thereof; and/or a JH sequence or derivative thereof.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a non-bovine sequence or a non-antibody sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is a synthetic sequence.

In some embodiments of each or any of the above or below mentioned embodiments, the non-antibody sequence is any one of SEQ ID NOS: 475-481.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a CX¹X²X³X⁴X⁵motif.

In some embodiments of each or any of the above or below mentioned embodiments, the (X^aX^b)_zmotif is YXYXYX.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵X_nmotif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q), and wherein n is 27-54.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises a X¹X²X³X⁴X⁵X_n(X^aX^b)_zmotif, wherein X₁is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X₂is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X₃is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X₄is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), wherein X₅is glutamine (Q), X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), wherein n is 27-54, and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a CX¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q), a cysteine motif selected from the group consisting of: CX₁₀CX₅CX₅CXCX₇C (SEQ ID NO: 41), CX₁₀CX₆CX₅CXCX₁₅C (SEQ ID NO: 42), CX₁₁CXCX₅C (SEQ ID NO: 43), CX₁₁CX₅CX₅CXCX₇C (SEQ ID NO: 44), CX₁₀CX₆CX₅CXCX₁₃C (SEQ ID NO: 45), CX₁₀CX₅CXCX₄CX₈C (SEQ ID NO: 46), CX₁₀CX₆CX₆CXCX₇C (SEQ ID NO: 47), CX₁₀CX₄CX₇CXCX₈C (SEQ ID NO: 48), CX₁₀CX₄CX₇CXCX₇C (SEQ ID NO: 49), CX₁₃CX₈CX₈C (SEQ ID NO: 50), CX₁₀CX₆CX₅CXCX₇C (SEQ ID NO: 51), CX₁₀CX₅CX₅C (SEQ ID NO: 52), CX₁₀CX₅CX₆CXCX₇C (SEQ ID NO: 53), CX₁₀CX₆CX₅CX₇CX₉C (SEQ ID NO: 54), CX₉CX₇CX₅CXCX₇C (SEQ ID NO: 55), CX₁₀CX₆CX₅CXCX₉C (SEQ ID NO: 56), CX₁₀CXCX₄CX₅CX₁₁C (SEQ ID NO: 57), CX₇CX₃CX₆CX₅CXCX₅CX₁₀C (SEQ ID NO: 58), CX₁₀CXCX₄CX₅CXCX₂CX₃C (SEQ ID NO: 59), CX₁₆CX₅CXC (SEQ ID NO: 60), CX₆CX₄CXCX₄CX₅C (SEQ ID NO: 61), CX₁₁CX₄CX₅CX₆CX₃C (SEQ ID NO: 62), CX₈CX₂CX₆CX₅C (SEQ ID NO: 63), CX₁₀CX₅CX₅CXCX₁₀C (SEQ ID NO: 64), CX₁₀CXCX₆CX₄CXC (SEQ ID NO: 65), CX₁₀CX₅CX₅CXCX₂C (SEQ ID NO: 66), CX₁₄CX₂CX₃CXCXC (SEQ ID NO: 67), CX₁₅CX₅CXC (SEQ ID NO: 68), CX₄CX₆CX₉CX₂CX₁₁C (SEQ ID NO: 69), CX₆CX₄CX₅CX₅CX₁₂C (SEQ ID NO: 70), CX₇CX₃CXCXCX₄CX₅CX₉C (SEQ ID NO: 71), CX₁₀CX₆CX₅C (SEQ ID NO: 72), CX₇CX₃CX₅CX₅CX₉C (SEQ ID NO: 73), CX₇CX₅CXCX₂C (SEQ ID NO: 74), CX₁₀CXCX₆C (SEQ ID NO: 75), CX₁₀CX₃CX₃CX₅CX₇CXCX₆C (SEQ ID NO: 76), CX₁₀CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 77), CX₁₂CX₄CX₅CXCXCX₉CX₃C (SEQ ID NO: 78), CX₁₂CX₄CX₅CX₁₂CX₂C (SEQ ID NO: 79), CX₁₀CX₆CX₅CXCX₁₁C (SEQ ID NO: 80), CX₁₆CX₅CXCXCX₁₄C (SEQ ID NO: 81), CX₁₀CX₅CXCX₈CX₆C (SEQ ID NO: 82), CX₁₂CX₄CX₅CX₈CX₂C (SEQ ID NO: 83), CX₁₂CX₅CX₅CXCX₈C (SEQ ID NO: 84), CX₁₀CX₆CX₅CXCX₄CXCX₉C (SEQ ID NO: 85), CX₁₁CX₄CX₅CX₈CX₂C (SEQ ID NO: 86), CX₁₀CX₆CX₅CX₈CX₂C (SEQ ID NO: 87), CX₁₀CX₆CX₅CXCX₈C (SEQ ID NO: 88), CX₁₀CX₆CX₅CXCX₃CX₈CX₂C (SEQ ID NO: 89), CX₁₀CX₆CX₅CX₃CX₈C (SEQ ID NO: 90), CX₁₀CX₆CX₅CXCX₂CX₆CX₅C (SEQ ID NO: 91), CX₇CX₆CX₃CX₃CX₉C (SEQ ID NO: 92), CX₉CX₈CX₅CX₆CX₅C (SEQ ID NO: 93), CX₁₀CX₂CX₂CX₇CXCX₁₁CX₅C (SEQ ID NO: 94), and CX₁₀CX₆CX₅CXCX₂CX₈CX₄C (SEQ ID NO: 95); and a (X^aX^b)_zmotif, X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.

In some embodiments of each or any of the above or below mentioned embodiments, the ultralong CDR3 comprises: a CX¹X²X³X⁴X⁵motif, wherein X¹is threonine (T), glycine (G), alanine (A), serine (S), or valine (V), wherein X²is serine (S), threonine (T), proline (P), isoleucine (I), alanine (A), valine (V), or asparagine (N), wherein X³is valine (V), alanine (A), threonine (T), or aspartic acid (D), wherein X⁴is histidine (H), threonine (T), arginine (R), tyrosine (Y), phenylalanine (F), or leucine (L), and wherein X⁵is glutamine (Q); a cysteine motif selected from the group consisting of: wherein the cysteine motif is selected from the group consisting of: CCX₃CXCX₃CX₂CCXCX₅CX₉CX₅CXC (SEQ ID NO: 96), CX₆CX₂CX₅CX₄CCXCX₄CX₆CXC (SEQ ID NO: 97), CX₇CXCX₅CX₄CCCX₄CX₆CXC (SEQ ID NO: 98), CX₉CX₃CXCX₂CXCCCX₆CX₄C (SEQ ID NO: 99), CX₅CX₃CXCX₄CX₄CCX₁₀CX₂CC (SEQ ID NO: 100), CX₅CXCX₁CXCX₃CCX₃CX₄CX₁₀C (SEQ ID NO: 101), CX₉CCCX₃CX₄CCCX₅CX₆C (SEQ ID NO: 102), CCX₈CX₅CX₄CX₃CX₄CCXCX₁C (SEQ ID NO: 103), CCX₆CCX₅CCCX₄CX₄CX₁₂C (SEQ ID NO: 104), CX₆CX₂CX₃CCCX₄CX₅CX₃CX₃C (SEQ ID NO: 105), CX₃CX₅CX₆CX₄CCXCX₅CX₄CXC (SEQ ID NO: 106), CX₄CX₄CCX₄CX₄CXCX₁₁CX₂CXC (SEQ ID NO: 107), CX₅CX₂CCX₅CX₄CCX₃CCX₇C (SEQ ID NO: 108), CX₅CX₅CX₃CX₂CXCCX₄CX₇CXC (SEQ ID NO: 109), CX₃CX₇CX₃CX₄CCXCX₂CX₅CX₂C (SEQ ID NO: 110), CX₉CX₃CXCX₄CCX₅CCCX₆C (SEQ ID NO: 111), CX₉CX₃CXCX₂CXCCX₆CX₃CX₃C (SEQ ID NO: 112), CX₈CCXCX₃CCX₃CXCX₃CX₄C (SEQ ID NO: 113), CX₉CCX₄CX₂CXCCXCX₄CX₃C (SEQ ID NO: 114), CX₁₀CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 115), CX₉CXCX₃CX₂CXCCX₄CX₅CXC (SEQ ID NO: 116), CX₆CCXCX₅CX₄CCXCX₅CX₂C (SEQ ID NO: 117), CX₆CCXCX₃CXCCX₃CX₄CC (SEQ ID NO: 118), CX₆CCXCX₃CXCX₂CXCX₄CX₈C (SEQ ID NO: 119), CX₄CX₂CCX₃CXCX₄CCX₂CX₃C (SEQ ID NO: 120), CX₃CX₅CX₃CCCX₄CX₉C (SEQ ID NO: 121), CCX₉CX₃CXCCX₃CX₅C (SEQ ID NO: 122), CX₉CX₂CX₃CX₄CCX₄CX₅C (SEQ ID NO: 123), CX₉CX₇CX₄CCXCX₇CX₃C (SEQ ID NO: 124), CX₉CX₃CCCX₁₀CX₂CX₃C (SEQ ID NO: 125), CX₃CX₅CX₅CX₄CCX₁₀CX₆C (SEQ ID NO: 126), CX₉CX₅CX₄CCXCX₅CX₄C (SEQ ID NO: 127), CX₇CXCX₆CX₄CCCX₁₀C (SEQ ID NO: 128), CX₈CX₂CX₄CCX₄CX₃CX₃C (SEQ ID NO: 129), CX₇CX₅CXCX₄CCX₇CX₄C (SEQ ID NO: 130), CX₁₁CX₃CX₄CCCX₈CX₂C (SEQ ID NO: 131), CX₂CX₃CX₄CCX₄CX₅CX₁₅C (SEQ ID NO: 132), CX₉CX₅CX₄CCX₇C (SEQ ID NO: 133), CX₉CX₇CX₃CX₂CX₆C (SEQ ID NO: 134), CX₉CX₅CX₄CCX₁₄C (SEQ ID NO: 135), CX₉CX₅CX₄CCX₈C (SEQ ID NO: 136), CX₉CX₆CX₄CCXC (SEQ ID NO: 137), CX₅CCX₇CX₄CX₁₂(SEQ ID NO: 138), CX₁₀CX₃CX₄CCX₄C (SEQ ID NO: 139), CX₉CX₄CCX₅CX₄C (SEQ ID NO: 140), CX₁₀CX₃CX₄CX₇CXC (SEQ ID NO: 141), CX₇CX₇CX₂CX₂CX₃C (SEQ ID NO: 142), CX₉CX₄CX₄CCX₆C (SEQ ID NO: 143), CX₇CXCX₃CXCX₆C (SEQ ID NO: 144), CX₇CXCX₄CXCX₄C (SEQ ID NO: 145), CX₉CX₅CX₄C (SEQ ID NO: 146), CX₃CX₆CX₈C (SEQ ID NO: 147), CX₁₀CXCX₄C (SEQ ID NO: 148), CX₁₀CCX₄C (SEQ ID NO: 149), CX₁₅C (SEQ ID NO: 150), CX₁₀C (SEQ ID NO: 151), and CX₉C (SEQ ID NO: 152); and ba (X^aX^b)_zmotif, wherein X^ais any amino acid residue, X^bis an aromatic amino acid selected from the group consisting of: tyrosine (Y), phenylalanine (F), tryptophan (W), and histidine (H), and wherein z is 1-4.