KR20120091251A - Sorf constructs and multiple gene expression - Google Patents

Sorf constructs and multiple gene expression Download PDF

Info

Publication number
KR20120091251A
KR20120091251A KR1020127013812A KR20127013812A KR20120091251A KR 20120091251 A KR20120091251 A KR 20120091251A KR 1020127013812 A KR1020127013812 A KR 1020127013812A KR 20127013812 A KR20127013812 A KR 20127013812A KR 20120091251 A KR20120091251 A KR 20120091251A
Authority
KR
South Korea
Prior art keywords
leu
vector
protein
intein
expression
Prior art date
Application number
KR1020127013812A
Other languages
Korean (ko)
Inventor
제럴드 알. 카슨
웬디 알. 기온
윈 제트. 쿤스
3세 월터 에프. 리즈
레이철 에이. 데이비스-타버
에마 풍
Original Assignee
아보트 러보러터리즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아보트 러보러터리즈 filed Critical 아보트 러보러터리즈
Publication of KR20120091251A publication Critical patent/KR20120091251A/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/395Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/24Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
    • C07K16/241Tumor Necrosis Factors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/24Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
    • C07K16/244Interleukins [IL]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/14Specific host cells or culture conditions, e.g. components, pH or temperature
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/76Antagonist effect on antigen, e.g. neutralization or inhibition of binding
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

본 발명의 양태들은 치료용 항체와 같은 다합체성 생성물을 포함하는 폴리펩타이드의 발현을 위한 벡터 작제물 및 방법에 관한 것이다. 특수한 작제물은 단일 전사 해독 프레임(sORF)으로부터 발현 생성물의 생성을 허용한다. 하나의 양태는 단일 전사 해독 프레임 삽입체를 포함하는 하나 이상의 재조합체 단백질 생성물을 생성하기 위한 분리되거나 정제된 발현 벡터를 제공하며; 상기 삽입체는 시그날 펩타이드를 암호화하는 시그날 펩타이드 핵산 서열; 제1의 폴리펩타이드를 암호화하는 제1의 핵산 서열; 제1의 단백질 절단 부위를 암호화하는 제1의 개재 핵산 서열을 포함하며, 여기서 상기 제1의 단백질 절단 부위는 파이로코쿠스의 lon 프로테아제 유전자 또는 파이로코쿠스 또는 메타노코쿠스의 klbA 유전자의 인테인 분절, 또는 이들로부터 기원한 변형된 인테인 분절에 의해 제공되며; 제2의 폴리펩타이드를 암호화하는 제2의 핵산 서열을 포함한다. 작제물 및 방법의 특정 양태는 파이로코쿠스 아비씨, 파이로코쿠스 푸리오수스 또는 파이로코쿠스 호리코시이 OT3의 lon 프로테아제 유전자의 인테인 분절; 또는 파이로코쿠스 아비씨, 파이로코쿠스 푸리오수스 또는 메타노코쿠스 잔나스키이의 klbA 유전자의 인테인 분절; 또는 다른 인테인 분절을 사용한다.Aspects of the invention relate to vector constructs and methods for the expression of polypeptides comprising multimeric products, such as therapeutic antibodies. Special constructs allow the production of expression products from a single transcriptional translation frame (sORF). One embodiment provides an isolated or purified expression vector for producing one or more recombinant protein products comprising a single transcription translation frame insert; The insert comprises a signal peptide nucleic acid sequence encoding a signal peptide; A first nucleic acid sequence encoding a first polypeptide; A first intervening nucleic acid sequence encoding a first protein cleavage site, wherein the first protein cleavage site is an intein segment of the lon protease gene of pyrococcus or the klbA gene of pyrococcus or metanococus. Or by modified intein segments derived from them; A second nucleic acid sequence encoding a second polypeptide. Certain embodiments of the constructs and methods include the intein segment of the lon protease gene of Pyrococcus acci, Pyrococcus furiosus or Pyrococcus horicose OT3; Or intein segments of the klbA gene of Pyrococcus acci, pyrococcus puriosus or Metanococcus jannasquiy; Or use another intein segment.

Figure P1020127013812
Figure P1020127013812

Description

SORF 작제물 및 다중 유전자 발현{SORF CONSTRUCTS AND MULTIPLE GENE EXPRESSION}SORF CONSTRUCTS AND MULTIPLE GENE EXPRESSION

관련 출원의 전후 참조Before and after reference of related application

본원은, 이의 전문이 본원에 참조로 혼입된, 제랄드 알, 카슨(Gerald R. Carson) 등에 의해 2009년 10월 30일자로 출원된, 미국 가특허원 제61/256,544호의 이익을 청구한다.This application claims the benefit of U.S. Provisional Patent Application 61 / 256,544, filed October 30, 2009 by Gerald R. Carson et al., Which is incorporated by reference in its entirety.

연방 정부에서 지원하는 연구 또는 개발에 대한 설명Explanation of Research or Development Supported by the Federal Government

해당사항 없음None

서열 목록, 표 또는 컴퓨터 프로그램 목록 Sequence list, table or computer program list 컴팩트Compact 디스크 부록에 대한 참조 Reference to disk appendix

해당사항 없음(서열 목록은 제공되나 컴팩트 디스크 부록으로는 제공되지 않음)Not applicable (sequence list is provided but not as a compact disc supplement)

재조합체 발현 기술의 분야에서, 바람직한 단백질 생성물의 고 생산 수준의 달성 및 바람직한 순도의 생성물을 생성하는 능력은 진행중인 챌린지(challenge)를 나타낸다. 이러한 챌린지는 항체인 생물학적 치료제를 포함하는 단백질 생성물에 특히 관련되어 있지만, 당해 분야에서의 진전은 또한 다른 생물제에도 관련성이 있다. 본 발명의 특정 양태는 적어도 부분적으로 이러한 챌린지의 하나 이상의 국면에 초점이 맞추어져 있다.In the field of recombinant expression techniques, the achievement of high levels of production of desired protein products and the ability to produce products of the desired purity represents an ongoing challenge. While such challenges are particularly relevant for protein products, including biological therapeutic agents that are antibodies, progress in the art is also relevant for other biological agents. Certain aspects of the present invention focus at least in part on one or more aspects of this challenge.

다음 약어들이 적용가능하다: ORF, 전사 해독 프레임(open reading frame); sORF, 단일 전사 해독 프레임; MW, 분자량; HC 또는 H, 면역글로불린 중쇄; LC 또는 L, 면역글로불린 경쇄; pab, 파이로코쿠스 아비씨(Pyrococcus abyssi); pfu, 파이로코쿠스 푸리오수스(Pyrococcus furiosus); pho, 파이로코쿠스 호리코시이(Pyrococcus horikoshii) OT3; aa 또는 AA, 아미노산(들); SP, 단일 펩타이드; LCSP, 경쇄 시그날 펩타이드; MTX, 메토트렉세이트.The following abbreviations are applicable: ORF, open reading frame; sORF, single transcription decode frame; MW, molecular weight; HC or H, immunoglobulin heavy chains; LC or L, immunoglobulin light chains; Pab, Pyrococcus abyssi ); Pfu, Pyrococcus furiosus ); pho, Pyrococcus horikoshii ) OT3; aa or AA, amino acid (s); SP, single peptide; LCSP, light chain signal peptide; MTX, methotrexate.

본 발명의 양태는 일반적으로 재조합체 발현 및, 재조합체 폴리프로테인(polyprotein) 및 전-단백질(pre-protein)의 해독-후 프로세싱(post-translational processing)을 포함하는 프로세싱을 위한 발현 카세트(expression cassette), 벡터 작제물, 재조합체 숙주 세포 및 방법에 관한 것이다. 양태들에서, 하나 이상의 발현된 생성물은 면역글로불린이다.Aspects of the present invention generally include expression cassettes for recombinant expression and processing including post-translational processing of recombinant polyproteins and pre-proteins. ), Vector constructs, recombinant host cells and methods. In aspects, the one or more expressed products is an immunoglobulin.

양태들에서, 발현 벡터는 하나 이상의 인테인 분절(intein segment)을 포함한다. 양태들에서, 인테인 분절들은 유기체 파이로코쿠스 아비씨, 파이로코쿠스 푸리오수스, 및 파이로코쿠스 호리코시이 OT3 중 하나 이상의 lon 인테인(lon intein)으로부터 기원한다.In aspects, the expression vector comprises one or more intein segments. In aspects, the intein segments originate from lon inteins of one or more of the organisms pyrococcus acci, pyrococcus puriosus, and pyrococcus horicose OT3.

양태들에서, 작제물의 구조(architecture)는 특정한 성분의 순서 및 존재 또는 부재의 관점에서 구성된다. 하나의 양태에서, 특정 벡터 유전자 분절의 순서는 HL이고, 여기서 H 및 L은 각각 면역글로불린 중쇄 및 경쇄를 나타낸다. 다른 양태에서, 순서는 LH이다. 특수 양태에서, 작제물은 (-)로 표지된 설계를 갖고, 여기서 마이너스 신호는 ORF의 개시부에서 1개의 시그날 펩타이드 및 인테인의 마지막 아미노산과 제2 단백질 소단위의 제1 아미노산, 예를 들면, 인테인 다음의 성숙한 항체 쇄 사이에 삽입된 메티오닌을 가짐을 나타낸다. 특수 양태에서, 작제물은 (+)로 표지된 설계를 가지고, 여기서 플러스 신호는 ORF의 개시부에서 제1의 시그날 펩타이드 및 인테인의 제2 단백질 소단위 하부의 개시부에서 제2의 시그날 펩타이드의 존재를 나타낸다. 특수 양태에서, 구조는 HL(-)이다.In aspects, the architecture of the construct is constructed in terms of the order and presence or absence of particular components. In one embodiment, the order of the particular vector gene segments is HL, where H and L represent immunoglobulin heavy and light chains, respectively. In another embodiment, the order is LH. In a particular embodiment, the construct has a design labeled (-), where the negative signal is at the beginning of the ORF with the last amino acid of one signal peptide and intein and the first amino acid of the second protein subunit, for example, It has a methionine inserted between the mature antibody chains following the intein. In a particular embodiment, the construct has a design labeled with (+), wherein the plus signal is that of the first signal peptide at the beginning of the ORF and of the second signal peptide at the beginning of the second protein subunit of the intein. Indicates presence In a particular embodiment, the structure is HL (-).

양태들에서, 본 발명은 일시적인 발현 조건하에서 실험들로부터 배양 상층액 속에서 측정하는 경우 분비된 생성물 ml당 2, 5, 10, 20, 30, 40, 또는 50 마이크로그람 초과인 단백질 발현 수준을 생산할 수 있는 sORF(단일 전사 해독 프레임) 작제물 설계를 제공한다. 양태들에서, 본 발명은 안정한 CHO(차이니즈 햄스터 난소) 세포 발현 시스템을 사용하는 조건을 사용한 실험으로부터 배양 상층액에서 측정시 1일당 ml당 20마이크로그람 초과인 단백질 발현 수준을 생산할 수 있는 sORF 작제물을 제공한다. 하나의 양태에서, 발현 수준(㎍/ml/일)은 1 내지 24, 10 초과 또는 20 초과의 범위이다. 특수 양태에서, 발현 수준은 24㎍/ml/일이다. 양태들에서, 단백질 발현은 중쇄 및 경쇄의 다합체성 단위로 자가-조립되는 분비된 항체이다. 양태들에서, 항체는 IgG 동형이다.In embodiments, the present invention will produce protein expression levels greater than 2, 5, 10, 20, 30, 40, or 50 micrograms per ml of secreted product when measured in culture supernatants from experiments under transient expression conditions. SORF (single transcription decoding frame) construct design. In aspects, the invention provides an sORF construct capable of producing protein expression levels greater than 20 micrograms per ml as measured in culture supernatants from experiments using conditions using a stable CHO (Chinese Hamster Ovary) cell expression system. To provide. In one embodiment, the expression level (μg / ml / day) ranges from 1 to 24, greater than 10 or greater than 20. In a particular embodiment, the expression level is 24 μg / ml / day. In embodiments, protein expression is a secreted antibody that self-assembles into multimeric units of heavy and light chains. In aspects, the antibody is IgG isotype.

하나의 양태에서, 본 발명은In one aspect, the invention

(a) 시그날 펩타이드를 암호화하는 시그날 펩타이드 핵산 서열; (a) a signal peptide nucleic acid sequence encoding a signal peptide;

(b) 제1의 폴리펩타이드를 암호화하는 제1의 핵산 서열;(b) a first nucleic acid sequence encoding a first polypeptide;

(c) 제1의 단백질 절단 부위를 암호화하는 제1의 개재(intervening) 핵산 서열(여기서 상기 제1의 단백질 절단 부위는 파이로코쿠스의 lon 프로테아제 유전자 또는 파이로코쿠스 또는 메타노코쿠스의 klbA 유전자 또는, 이로부터 기원한 변형된 인테인 분절이다); 및(c) a first intervening nucleic acid sequence encoding a first protein cleavage site, wherein the first protein cleavage site is a lon protease gene of pyrococcus or a klbA gene of pyrococcus or metanococus or , Modified intein segments derived therefrom); And

(d) 제2의 폴리펩타이드를 암호화하는 제2의 핵산 서열을 포함하는 단일 전사 해독 프레임 삽입체를 포함하는 하나 이상의 재조합체 단백질 생성물을 생성하기 위한 분리되거나 정제된 발현 벡터를 제공하며, 여기서 상기 제1의 단백질 절단 부위를 암호화하는 제1의 개재 핵산 서열은 상기 제1의 핵산 서열과 상기 제2의 핵산 서열 사이에 작동적으로 위치하고; 여기서 상기 시그날 펩타이드를 암호화하는 상기 시그날 펩타이드 핵산 서열은 상기 제1의 핵산 서열 앞에 작동적으로 위치하며; 여기서 상기 발현 벡터는 상기 제1의 단백질 절단 부위에서 절단가능한 단일 전사 해독 프레임 폴리펩타이드를 발현할 수 있다.(d) providing an isolated or purified expression vector for producing one or more recombinant protein products comprising a single transcription translation frame insert comprising a second nucleic acid sequence encoding a second polypeptide, wherein A first intervening nucleic acid sequence encoding a first protein cleavage site is operatively located between the first nucleic acid sequence and the second nucleic acid sequence; Wherein the signal peptide nucleic acid sequence encoding the signal peptide is operably positioned before the first nucleic acid sequence; Wherein the expression vector may express a single transcription translation frame polypeptide cleavable at the first protein cleavage site.

각종 개재 분절 및 방법을 포함하는 양태들의 내용에서 명확성을 위해, 단백질 절단 부위를 암호화하는 개재 핵산 서열은, 개재 핵산 서열이 적어도 제1의 단백질 절단 부위를 암호화하도록 존재할 수 있다. 원형 인테인에서, 예를 들면, 절단 반응은 일반적으로 자가과정이며 신속한 방식으로 진행된다. 추가의 설명은 부분적으로 잠재하는 메카니즘(underlying mechanism)의 이해에 의존한다. 엑스테인(extein) 성분을 보는 프로세싱 후 관점으로부터, 인테인 분절의 N-말단 및 C-말단 각각을 향해 제1의 단백질 절단 부위 및 제2의 단백질 절단 부위가 존재함을 이해할 수 있다. 절단 부위의 설계는, 절단 반응이 발생할 수 있는 순서에 필수적으로 상응하는 것으로 의도되지 않으며, 제공된 메카니즘에 있어서 역학적으로 명백한 단계들의 인식이 존재하는 경우에서 조차 하나의 절단 반응 부위에서 단일이고 비교적 조화된 현상인 것으로 절단 반응의 인식이 존재할 수 있다는 것이 인식된다. 이러한 기술은 또한 당해 분야에서 이해될 수 있는 것으로서 하나 이상의 절단 부위를 포함하는 개재 분절을 사용한 조성물 및 방법의 양태들을 제공한다. 다시 프로세싱 메카니즘의 이해에 따라서, 1개의 절단 부위 또는 2개의 분열 부위를 포함하는 분절은 각각 개재 분절의 부분적이거나 완전한 절제를 허용할 수 있다.For clarity in the context of embodiments involving various intervening segments and methods, intervening nucleic acid sequences encoding protein cleavage sites may be present such that the intervening nucleic acid sequences encode at least a first protein cleavage site. In circular intein, for example, the cleavage reaction is generally autonomous and proceeds in a rapid manner. Further explanation relies in part on understanding the underlying mechanism. From the post-processing point of view of the extein component, it can be understood that there is a first protein cleavage site and a second protein cleavage site towards each of the N-terminus and C-terminus of the intein segment. The design of the cleavage site is not intended to necessarily correspond to the order in which cleavage reactions may occur, and is single and relatively harmonized at one cleavage reaction site even when there is a recognition of dynamically apparent steps in the mechanism provided. It is recognized that there may be recognition of cleavage reactions as being a phenomenon. This technique also provides aspects of compositions and methods using intervening segments that include one or more cleavage sites, as would be understood in the art. Again, upon understanding of the processing mechanism, segments comprising one cleavage site or two cleavage sites may each allow partial or complete excision of the intervening segment.

하나의 양태에서, 개재 핵산 서열은 또한 제2의 단백질 절단 부위를 암호화한다.In one embodiment, the intervening nucleic acid sequence also encodes a second protein cleavage site.

발현 벡터의 하나의 양태에서, 제1의 단백질 절단 부위는 파이로코쿠스 아비씨, 파이로코쿠스 푸리오수스 또는 파이로코쿠스 호리코시이 OT3의 이온 프로테아제 유전자의 인테인 분절; 또는 파이로코쿠스 아비씨, 파이로코쿠스 푸리오수스 또는 메타노코쿠스 잔나스키이(Methanococcus jannaschii)의 klbA 유전자의 인테인 분절; 또는 이로부터 각각 기원한 변형된 인테인 분절에 의해 제공된다.In one embodiment of the expression vector, the first protein cleavage site comprises an intein segment of the ion protease gene of Pyrococcus acci, Pyrococcus puriosus or Pyrococcus horicose OT3; Or intein segments of the klbA gene of Pyrococcus acci, Pyrococcus puriosus or Methanococcus jannaschii; Or by modified intein segments, each originating therefrom.

하나의 양태에서, 인테인 분절 또는 변형된 인테인 분절은 리신, 세린이지만 히스티딘이 아닌 끝에서 두번째 잔기(penultimate residue)를 암호화한다. 하나의 양태에서, 인테인 분절 또는 변형된 인테인 분절은 상기 제1의 폴리펩타이드를 절단할 수는 있지만 이를 상기 제2의 폴리펩타이드에 완전히 연결하는 것은 아니다.In one embodiment, the intein segment or modified intein segment encodes a penultimate residue at the end of lysine, serine but not histidine. In one embodiment, an intein segment or a modified intein segment may cleave the first polypeptide but not fully connect it to the second polypeptide.

하나의 양태에서, 제1의 단백질 절단 부위는 서열 번호: 1, 3, 4, 6, 7, 55, 35, 37, 및 39로 이루어진 그룹에서 선택된 서열을 포함하는 인테인 분절 및 이로부터 기원한 변형된 인테인 분절에 의해 제공된다.In one embodiment, the first protein cleavage site is an intein segment comprising a sequence selected from the group consisting of SEQ ID NOs: 1, 3, 4, 6, 7, 55, 35, 37, and 39 and derived therefrom. Provided by modified intein segments.

하나의 양태에서, 제1의 폴리펩타이드 및 제2의 폴리펩타이드는 다합체성 조립이 가능하다. 하나의 양태에서, 상기 제1의 폴리펩타이드 및 제2의 폴리펩타이드 중 적어도 하나는 세포외 분비할 수 있다. 하나의 양태에서, 상기 제1의 폴리펩타이드 및 제2의 폴리펩타이드 중 적어도 하나는 포유동물 기원이다. 하나의 양태에서, 제1의 폴리펩타이드는 면역글로불린 중쇄 또는 이의 기능성 단편을 포함하고, 상기 제2의 폴리펩타이드는 면역글로불린 경쇄 또는 이의 기능성 단편을 포함하며, 상기 제1의 폴리펩타이드는 상기 제2의 폴리펩타이드의 상부(제2의 폴리펩타이드에 대해 5')에 존재한다.In one embodiment, the first polypeptide and the second polypeptide are capable of multimeric assembly. In one embodiment, at least one of the first polypeptide and the second polypeptide can secrete extracellularly. In one embodiment, at least one of the first polypeptide and the second polypeptide is of mammalian origin. In one embodiment, the first polypeptide comprises an immunoglobulin heavy chain or functional fragment thereof, and the second polypeptide comprises an immunoglobulin light chain or functional fragment thereof, wherein the first polypeptide is the second polypeptide At the top of the polypeptide of (5 'for the second polypeptide).

발현 벡터의 양태에서, 벡터는 단지 하나의 시그날 펩타이드 핵산 서열을 포함한다.In an aspect of an expression vector, the vector comprises only one signal peptide nucleic acid sequence.

하나의 양태에서, 발현 벡터는 제3의 폴리펩타이드를 암호화하는 제3의 핵산 서열, 및 제2의 단백질 절단 부위를 암호화하는 제2의 개재 핵산 서열을 추가로 포함하며; 여기서, 제2의 개재 핵산 서열 및 제3의 핵산 서열은, 이러한 순서로 상기 제2의 핵산 서열 이후에 작동적으로 위치한다.In one embodiment, the expression vector further comprises a third nucleic acid sequence encoding a third polypeptide, and a second intervening nucleic acid sequence encoding a second protein cleavage site; Here, the second intervening nucleic acid sequence and the third nucleic acid sequence are operatively located after the second nucleic acid sequence in this order.

발현 벡터의 양태에서, 제1 및 상기 제2의 폴리펩타이드는 종양 괴사 인자-α, 에리트로포이에틴 수용체, RSV, EL/셀렉틴, 인터루킨-1, 인터루킨-12, 인터루킨-13, 인터루킨-17, 인터루킨-18, 인터루킨-23, 인터루킨-33, CD81, CD19, IGF1, IGF2, EGFR, CXCL-13, GLP-1R, 프로스타글란딘 E2 및 아밀로이드 베타로 이루어진 그룹에서 선택된 항원에 결합하는 것에 대해 지시된 항원 특이성을 지닌, 기능적 항원 또는 다른 항원 인식 분자를 포함한다.In an embodiment of an expression vector, the first and second polypeptides are tumor necrosis factor-α, erythropoietin receptor, RSV, EL / selectin, interleukin-1, interleukin-12, interleukin-13, interleukin-17, interleukin. Antigen specificity directed against binding to an antigen selected from the group consisting of -18, interleukin-23, interleukin-33, CD81, CD19, IGF1, IGF2, EGFR, CXCL-13, GLP-1R, prostaglandin E2 and amyloid beta And functional antigen or other antigen recognition molecule.

본 발명의 양태에서, 발현 벡터의 경우 제1 및 제2의 폴리펩타이드는 D2E7, EL246, ABT-007, ABT-325, 또는 ABT-874의 항체로부터의 면역글로불린 쇄의 쌍을 포함한다. 하나의 양태에서, 제1 및 제2의 폴리펩타이드는 D2E7, EL246, ABT-007, ABT-325, ABT-874, 또는 다른 항체의 유사 분절로부터의 면역글로불린 중쇄 또는 면역글로불린 경쇄 분절로부터 각각 독립적으로 선택된다.In an embodiment of the invention, for the expression vector the first and second polypeptides comprise a pair of immunoglobulin chains from an antibody of D2E7, EL246, ABT-007, ABT-325, or ABT-874. In one embodiment, the first and second polypeptides are each independently from an immunoglobulin heavy chain or an immunoglobulin light chain segment from analog segments of D2E7, EL246, ABT-007, ABT-325, ABT-874, or other antibodies. Is selected.

하나의 양태에서, 발현 벡터는 상기 삽입체에 대한 프로모터 조절 성분을 추가로 포함한다. 하나의 양태에서, 프로모터 조절 성분은 유도성 또는 구성적이다. 하나의 양태에서, 프로모터 조절 성분은 조직 특이적이다. 하나의 양태에서, 프로모터는 아데노바이러스 주요 레이트 프로모터(adenovirus major late 프로모터)를 포함한다.In one embodiment, the expression vector further comprises a promoter regulatory component for said insert. In one embodiment, the promoter regulatory component is inducible or constitutive. In one embodiment, the promoter regulatory component is tissue specific. In one embodiment, the promoter comprises an adenovirus major late promoter.

하나의 양태에서, 본 발명은 본원에 기술된 벡터를 포함하는 숙주 세포를 제공한다. 하나의 양태에서, 숙주 세포는 원핵 세포이다. 하나의 양태에서, 숙주 세포는 에스케리키아 콜라이이다. 하나의 양태에서, 숙주 세포는 진핵 세포이다. 하나의 양태에서, 진핵 세포는 원생생물 세포, 동물 세포, 식물 세포 및 진균 세포로 이루어진 그룹에서 선택된다. 하나의 양태에서, 진핵 세포는 포유동물 세포, 조류 세포 및 곤충 세포로 이루어진 그룹에서 선택된 동물 세포이다. 하나의 양태에서, 숙주 세포는 포유동물 세포주이다. 하나의 양태에서, 숙주 세포는 CHO 세포 또는 디하이드로폴레이트 리덕타제-결핍성 CHO 세포이다. 하나의 양태에서, 숙주 세포는 HEK(사람 배아 신장) 세포 또는 아프리카 녹색 원숭이 신장 세포, 예를 들면, COS 세포이다. 하나의 양태에서, 숙주 세포는 효모 세포이다. 하나의 양태에서, 효모 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)이다. 하나의 양태에서, 숙주 세포는 스포도프테라 프루기페르다(Spodoptera frugiperda) Sf9 곤충 세포이다.In one aspect, the invention provides a host cell comprising the vector described herein. In one embodiment, the host cell is a prokaryotic cell. In one embodiment, the host cell is Escherichia coli. In one embodiment, the host cell is a eukaryotic cell. In one embodiment, the eukaryotic cells are selected from the group consisting of protozoal cells, animal cells, plant cells and fungal cells. In one embodiment, the eukaryotic cell is an animal cell selected from the group consisting of mammalian cells, avian cells and insect cells. In one embodiment, the host cell is a mammalian cell line. In one embodiment, the host cell is a CHO cell or a dihydrofolate reductase-deficient CHO cell. In one embodiment, the host cell is a HEK (human embryonic kidney) cell or an African green monkey kidney cell, eg, a COS cell. In one embodiment, the host cell is a yeast cell. In one embodiment, the yeast cells are Saccharomyces cerevisiae ). In one embodiment, the host cell is a Spodoptera frugiperda Sf9 insect cell.

하나의 양태에서, 본 발명은 숙주 세포를 벡터 단백질의 발현을 허용하기에 충분한 조건하에서 배양 배지 속에서 배양함을 포함하여, 재조합체 폴리프로테인 또는 다수의 단백질을 생산하는 방법을 제공한다. 하나의 양태에서, 당해 방법은 상기 벡터 단백질을 회수하고/하거나 정제함을 추가로 포함한다. 생산 방법의 양태에서, 다수의 단백질은 다합체성 조립이 가능하다. 하나의 양태에서, 재조합체 폴리프로테인 또는 다수의 단백질은 생물학적으로 기능성이고/이거나 치료제이다.In one embodiment, the present invention provides a method for producing recombinant polyprotein or a plurality of proteins, including culturing the host cell in culture medium under conditions sufficient to allow expression of the vector protein. In one embodiment, the method further comprises recovering and / or purifying the vector protein. In an aspect of the production method, multiple proteins are capable of multimeric assembly. In one embodiment, the recombinant polyprotein or multiple proteins are biologically functional and / or therapeutic.

하나의 양태에서, 본 발명은 숙주 세포를 배양 배지 속에서 재조합체 생성물을 생산하기에 충분한 조건하에 배양함을 포함하여, 재조합체 생성물을 생산하는 방법을 제공하며, 여기서, 생성물은 면역글로불린 단백질 또는 이의 기능성 단편, 조립된 항체, 또는 다른 항원 인식 분자이다. 하나의 양태에서, 본 발명은 본원에 기술된 방법에 따라 생산된 단백질 또는 폴리프로테인을 제공한다. 하나의 양태에서, 본 발명은 본원의 방법에 따라 조립된 면역글로불린; 조립된 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 생산된 이의 기능성 단편을 제공한다. 하나의 양태에서, 면역글로불린; 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편과 관련하여, 종양 괴사 인자-α, 에리트로포이에틴 수용체, RSV, EL/셀렉틴, 인터루킨-1 , 인터루킨-12, 인터루킨-13, 인터루킨 17, 인터루킨-18, 인터루킨-23, 인터루킨-33, CD81 , CD19, IGF1, IGF2, EGFR, CXCL-13, GLP-1R, 프로스타글란딘 E2 또는 아밀로이드 베타에 결합하는 특이적인 항원(여기서, 항원은 리간드 또는 역수용체 등일 수 있다)에 영향을 미치거나 기여하는 능력이 존재한다. 하나의 양태에서, 면역글로불린 또는 이의 기능성 단편은 면역글로불린 D2E7 또는 ABT-874이거나 기능성 단편은 각각 이의 단편이다.In one embodiment, the present invention provides a method of producing a recombinant product comprising culturing a host cell under conditions sufficient to produce the recombinant product in a culture medium, wherein the product is an immunoglobulin protein or Functional fragments thereof, assembled antibodies, or other antigen recognition molecules. In one embodiment, the present invention provides a protein or polyprotein produced according to the methods described herein. In one aspect, the invention provides an immunoglobulin assembled according to the methods herein; Assembled other antigen recognition molecule; Or individual immunoglobulin chains or functional fragments thereof produced. In one embodiment, immunoglobulins; Other antigen recognition molecules; Or with respect to individual immunoglobulin chains or functional fragments thereof, tumor necrosis factor-α, erythropoietin receptor, RSV, EL / selectin, interleukin-1, interleukin-12, interleukin-13, interleukin 17, interleukin-18, Specific antigens that bind to interleukin-23, interleukin-33, CD81, CD19, IGF1, IGF2, EGFR, CXCL-13, GLP-1R, prostaglandin E2 or amyloid beta, where the antigen may be a ligand or a reverse receptor, etc. Ability to influence or contribute to In one embodiment, the immunoglobulin or functional fragment thereof is an immunoglobulin D2E7 or ABT-874 or the functional fragment is each a fragment thereof.

하나의 양태에서, 본 발명은 치료학적 유효량의 단백질 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물을 제공한다.In one embodiment, the present invention provides a pharmaceutical composition comprising a therapeutically effective amount of a protein and a pharmaceutically acceptable carrier.

하나의 양태에서, 본 발명은 태그(tag)를 암호화하는 핵산 서열을 추가로 포함하는 본원에 기술된 발현 벡터를 제공한다. 벡터 작제물의 양태에서, 개재 핵산 서열은 태그를 추가로 암호화한다.In one aspect, the invention provides an expression vector described herein further comprising a nucleic acid sequence encoding a tag. In an embodiment of the vector construct, the intervening nucleic acid sequence further encodes a tag.

하나의 양태에서, 제1 및 상기 제2의 폴리펩타이드는 종양 괴사 인자-α, 에리트로포이에틴 수용체, RSV, EL/셀렉틴, 인터루킨-1 , 인터루킨-12, 인터루킨-13, 인터루킨 17, 인터루킨-18, 인터루킨-23, 인터루킨-33, CD81 , CD19, IGF1, IGF2, EGFR, CXCL-13, GLP-1R, 프로스타글란딘 E2 및 아밀로이드 베타로 이루어진 그룹에서 선택된 항원에 결합하는 것에 대해 지시된 항원 특이성을 갖는 기능성 항체 또는 다른 항원 인식 분자를 포함한다. 하나의 양태에서, 제1 및 제2의 폴리펩타이드는 D2E7, EL246, ABT-007, ABT-325, 또는 ABT-874의 항체로부터의 면역글로불린 쇄의 쌍을 포함한다. 하나의 양태에서, 제1 및 제2의 폴리펩타이드는 D2E7, EL246, ABT-007, ABT-325, ABT-874, 또는 다른 항체의 유사 분절로부터의 면역글로불린 중쇄 또는 면역글로불린 경쇄 분절로부터 각각 독립적으로 선택된다.In one embodiment, the first and second polypeptides are tumor necrosis factor-α, erythropoietin receptor, RSV, EL / selectin, interleukin-1, interleukin-12, interleukin-13, interleukin 17, interleukin-18 , Functional with antigen specificity directed against binding to an antigen selected from the group consisting of interleukin-23, interleukin-33, CD81, CD19, IGF1, IGF2, EGFR, CXCL-13, GLP-1R, prostaglandin E2 and amyloid beta Antibodies or other antigen recognition molecules. In one embodiment, the first and second polypeptides comprise a pair of immunoglobulin chains from an antibody of D2E7, EL246, ABT-007, ABT-325, or ABT-874. In one embodiment, the first and second polypeptides are each independently from an immunoglobulin heavy chain or an immunoglobulin light chain segment from analog segments of D2E7, EL246, ABT-007, ABT-325, ABT-874, or other antibodies. Is selected.

하나의 양태에서, 벡터는 상기 sORF 삽입체에 대한 프로모터 조절 성분을 추가로 포함한다. 하나의 양태에서, 상기 프로모터 조절 성분은 유도성 또는 구성적이다. 하나의 양태에서, 상기 프로모터 조절 성분은 조직 특이적이다. 하나의 양태에서, 상기 프로모터는 아데노바이러스 주요 레이트 프로모터(adenovirus major late promoter)를 포함한다.In one embodiment, the vector further comprises a promoter regulatory component for said sORF insert. In one embodiment, the promoter regulatory component is inducible or constitutive. In one embodiment, the promoter regulatory component is tissue specific. In one embodiment, the promoter comprises an adenovirus major late promoter.

하나의 양태에서, 벡터는 상기 제1의 단백질 절단 부위를 절단할 수 있는 프로테아제를 암호화하는 핵산을 추가로 포함한다. 하나의 양태에서, 프로테아제를 암호화하는 상기 핵산은 상기 sORF 삽입체내에 작동적으로 위치하며; 상기 발현 벡터는 프로테아제를 암호화하는 상기 핵산과 상기 제1의 핵산 및 상기 제2의 핵산 중 적어도 하나 사이에 위치한 제2의 절단 부위를 암호화하는 추가의 핵산을 추가로 포함한다.In one embodiment, the vector further comprises a nucleic acid encoding a protease capable of cleaving said first protein cleavage site. In one embodiment, the nucleic acid encoding a protease is operably located within the sORF insert; The expression vector further comprises an additional nucleic acid encoding a nucleic acid encoding a protease and a second cleavage site located between at least one of the first nucleic acid and the second nucleic acid.

하나의 양태에서, 본 발명은 본원에 기술된 벡터를 포함하는 숙주 세포를 제공한다. 하나의 양태에서, 숙주 세포는 원핵 세포이다. 하나의 양태에서, 상기 숙주 세포는 에스케리키아 콜라이(Escherichia coli)이다. 하나의 양태에서, 상기 숙주 세포는 진핵 세포이다. 하나의 양태에서, 상기 진핵 세포는 원생생물 세포, 동물 세포, 식물 세포 및 진균 세포로 이루어진 그룹에서 선택된다. 하나의 양태에서, 상기 진핵 세포는 포유동물 세포, 조류 세포 및 곤충 세포로 이루어진 그룹에서 선택된 동물 세포이다. 바람직한 양태에서, 상기 숙주 세포는 CHO 세포 또는 디하이드로폴레이트 리덕타제-결핍성 CHO 세포이다. 하나의 양태에서, 상기 숙주 세포는 COS 세포이다. 하나의 양태에서, 상기 숙주 세포는 효모 세포이다. 하나의 양태에서, 상기 효모 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)이다. 하나의 양태에서, 상기 숙주 세포는 곤충 스포도프테라 프루기페르다(Spodoptera frugiperda) Sf9 세포이다. 하나의 양태에서, 상기 숙주 세포는 사람 배아 신장 세포이다.In one aspect, the invention provides a host cell comprising the vector described herein. In one embodiment, the host cell is a prokaryotic cell. In one embodiment, the host cell is Escherichia coli . In one embodiment, the host cell is a eukaryotic cell. In one embodiment, the eukaryotic cell is selected from the group consisting of protozoal cells, animal cells, plant cells and fungal cells. In one embodiment, the eukaryotic cell is an animal cell selected from the group consisting of mammalian cells, avian cells and insect cells. In a preferred embodiment, the host cell is a CHO cell or a dihydrofolate reductase-deficient CHO cell. In one embodiment, the host cell is a COS cell. In one embodiment, the host cell is a yeast cell. In one embodiment, the yeast cell is Saccharomyces cerevisiae. In one embodiment, the host cell is an insect Spodoptera frugiperda Sf9 cell. In one embodiment, the host cell is a human embryonic kidney cell.

하나의 양태에서, 본 발명은 숙주 세포를 배양 배지 속에서 벡터 단백질의 발현을 허용하기에 충분한 조건하에 배양함을 포함하여, 재조합체 폴리프로테인 또는 다수의 단백질을 생산하는 방법을 제공한다. 하나의 양태에서, 당해 방법은 상기 벡터 단백질을 회수하고/하거나 정제함을 추가로 포함한다. 하나의 양태에서, 상기 다수의 단백질은 다합체성 조립이 가능하다. 하나의 양태에서, 재조합체 폴리프로테인 또는 다수의 단백질은 생물학적으로 기능성이고/이거나 치료제이다.In one embodiment, the present invention provides a method for producing recombinant polyprotein or a plurality of proteins, including culturing the host cell under conditions sufficient to allow expression of the vector protein in the culture medium. In one embodiment, the method further comprises recovering and / or purifying the vector protein. In one embodiment, the plurality of proteins are capable of multimeric assembly. In one embodiment, the recombinant polyprotein or multiple proteins are biologically functional and / or therapeutic.

하나의 양태에서, 본 발명은 특허청구범위 제38항에 따른 숙주 세포를 배양 배지 속에서 면역글로불린 단백질 또는 이의 기능성 단편, 조립된 항체, 또는 다른 항원 인식 분자를 생산하기에 충분한 조건하에서 배양함을 포함하여, 면역글로불린 단백질 또는 이의 기능성 단편, 조립된 항체, 또는 다른 항원 인식 분자를 생산하는 방법을 제공한다.In one embodiment, the present invention provides a method of culturing a host cell according to claim 38 under conditions sufficient to produce an immunoglobulin protein or functional fragment thereof, assembled antibody, or other antigen recognition molecule in a culture medium. Including, immunoglobulin proteins or functional fragments thereof, assembled antibodies, or other antigen recognition molecules.

하나의 양태에서, 본 발명은 본원의 방법에 따라 생산된 단백질 또는 폴리프로테인을 제공한다. 하나의 양태에서, 본 발명은 본원의 방법에 따라 생산된 조립된 면역글로불린; 조립된 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편을 제공한다. 하나의 양태에서, 면역글로불린; 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편은 종양 괴사 인자-α, 에리트로포이에틴 수용체, 인터루킨-18, EL/셀렉틴 또는 인터루킨-12에 결합하는 특이적인 항원 결합에 영향을 미치거나 기여하는 능력을 가진다. 하나의 양태에서, 면역글로불린은 D2E7이거나 여기서 기능성 단편은 D2E7의 단편이다.In one embodiment, the invention provides a protein or polyprotein produced according to the methods herein. In one aspect, the invention provides an assembled immunoglobulin produced according to the methods herein; Assembled other antigen recognition molecule; Or individual immunoglobulin chains or functional fragments thereof. In one embodiment, immunoglobulins; Other antigen recognition molecules; Or the individual immunoglobulin chains or functional fragments thereof have the ability to influence or contribute specific antigen binding to tumor necrosis factor-α, erythropoietin receptor, interleukin-18, EL / selectin or interleukin-12. . In one embodiment, the immunoglobulin is D2E7 or wherein the functional fragment is a fragment of D2E7.

하나의 양태에서, 본 발명은 발현 벡터, 벡터를 지닌 숙주 세포, 벡터 발현 생성물, 약제학적 조성물 및/또는 앞서의 것들 중 어느 것을 제조하거나 사용하는 방법을 제공하며, 여기서 벡터는 특허청구범위의 제1항 내지 제9항 중의 어느 한 항에 따른 벡터이고 경쇄 시그날 펩타이드를 암호화하는 분절을 추가로 포함한다. 하나의 양태에서, 암호화된 경쇄 시그날 펩타이드는 A17, A18, A19, A26, 및 H2G로 이루어진 그룹에서 선택된 카파 경쇄 시그날 펩타이드이다. 하나의 양태에서, 암호화된 경쇄 시그날 펩타이드는 VKII 카파 경쇄 시그날 펩타이드 A18, 서열 번호 82(아미노산 서열 MRLPAQLLGLLMLWIPGSSA)이다.In one embodiment, the present invention provides an expression vector, a host cell with the vector, a vector expression product, a pharmaceutical composition and / or a method of making or using any of the foregoing, wherein the vector is defined in the claims. A vector according to any one of claims 1 to 9 and further comprising a segment encoding a light chain signal peptide. In one embodiment, the encoded light chain signal peptide is a kappa light chain signal peptide selected from the group consisting of A17, A18, A19, A26, and H2G. In one embodiment, the encoded light chain signal peptide is VKII kappa light chain signal peptide A18, SEQ ID NO: 82 (amino acid sequence MRLPAQLLGLLMLWIPGSSA).

하나의 양태에서, 본 발명의 조성물은 분리되거나 정제된다.In one embodiment, the compositions of the present invention are isolated or purified.

하나의 양태에서, 본 발명의 조성물은 펩타이드 화합물이다. 하나의 양태에서, 본 발명의 조성물은 핵산 화합물이다. 하나의 양태에서, 본 발명의 펩타이드 화합물은 펩타이드 또는 하나 이상의 다른 펩타이드와의 다합체성 복합체로 조립된다.In one embodiment, the composition of the present invention is a peptide compound. In one embodiment, the composition of the present invention is a nucleic acid compound. In one embodiment, the peptide compounds of the invention are assembled into a multimeric complex with a peptide or one or more other peptides.

하나의 양태에서, 본 발명은 본 발명의 조성물을 포함하는 약제학적 제형을 제공한다. 하나의 양태에서, 본 발명은 본 발명의 조성물 또는 이의 약제학적 제형을 합성하는 방법을 제공한다. 하나의 양태에서, 약제학적 제형은 당해 분야에서 이해될 수 있는 것으로서 하나 이상의 부형제, 담체 및/또는 다른 성분들을 포함한다. 하나의 양태에서, 본 발명의 조성물의 유효량은 치료학적 유효량일 수 있다.In one embodiment, the present invention provides a pharmaceutical formulation comprising a composition of the present invention. In one embodiment, the present invention provides a method of synthesizing a composition of the present invention or a pharmaceutical formulation thereof. In one embodiment, the pharmaceutical formulation includes one or more excipients, carriers and / or other ingredients as would be understood in the art. In one embodiment, the effective amount of the composition of the present invention may be a therapeutically effective amount.

하나의 양태에서, 본 발명의 펩타이드 조성물은 재조합체 방법론 또는 합성 기술을 사용하여 제조된다. 하나의 양태에서, 본 발명의 핵산 조성물은 재조합체 방법론 또는 합성 기술을 사용하여 제조된다.In one embodiment, the peptide composition of the present invention is prepared using recombinant methodology or synthetic techniques. In one embodiment, the nucleic acid compositions of the present invention are prepared using recombinant methodology or synthetic techniques.

양태들에서, 본 발명은 의약을 제조하는데 있어 사용 방법을 제공한다.In embodiments, the present invention provides a method of use in the manufacture of a medicament.

본 발명의 양태의 다른 국면, 특징 및 장점은 첨부된 도면 및 당해 분야의 내용과 함께 고려하는 경우 하기 설명으로부터 명백하다.Other aspects, features, and advantages of aspects of the invention are apparent from the following description when considered in conjunction with the accompanying drawings and the teachings in the art.

일반적으로, 본원에 사용된 용어들 및 어구들은 당해 분야의 숙련가에게 공지된 표준 교재, 학술지 참조 문헌 및 내용들을 참조로 하여 밝혀질 수 있는 이들의 당해 분야에서 인식된 의미를 갖는다. 본원에 제공된 정의들은 본 발명의 양태들의 내용에서 이들의 특수한 용도를 명확히하기 위한 의도이다.In general, the terms and phrases used herein have their recognized meaning in the art as can be found by reference to standard textbooks, journal references, and content known to those skilled in the art. The definitions provided herein are intended to clarify their particular use in the context of aspects of the invention.

어떠한 특수 이론에 얽메이지 않고, 본 발명과 관련된 잠재하는 원리 또는 메카니즘의 이해 또는 확신이 본원의 논의일 수 있다. 어떠한 설명 또는 가설의 궁극적인 정확성에 상관없이, 본 발명의 양태는 그렇더라도 작동적이고 유용할 수 있다.
Without being bound by any particular theory, an understanding or certainty of the underlying principles or mechanisms associated with the present invention may be a discussion herein. Regardless of the ultimate accuracy of any description or hypothesis, aspects of the present invention may nevertheless be operational and useful.

도 1은 sORF 발현 작제물, pTT3 pab lon HL(-)의 개략도를 나타낸다.
도 2는 D2E7 항체에 대한 발현 작제물에 있어서 sORF 성분들의 구조를 나타낸다.
도 3은 sORF 발현 생성물의 단백질 분석을 위한 SDS-PAGE의 결과를 나타낸다. 분비된 IgG 분자는 단백질 A 친화성 크로마토그래피로 정제하고 SDS-PAGE에 의해 비-환원 (A) 및 환원 (B) 조건하에서 분리한다. 좌측으로부터 우측까지의 레인(lane) 및 시료는 다음과 같다: (레인 1 ) MW 참조 마커; (2) 대조군 작제물 생성물; (3) Pab-lon mut A1; (4) Pab-lon mut A2; (5) pTT3 pfu lon YP, 및 (6) pTT3 pfu lon MA.
도 4는 추가의 sORF 발현 생성물의 단백질 분석을 위한 SDS-PAGE의 결과를 나타낸다. 분비된 IgG는 단백질 A 친화성 크로마토그래피에 의해 정제되고 비-환원 (A) 및 환원 (B) 조건하에 SDS-PAGE에 의해 분리했다. 좌측으로부터 우측까지의 레인 및 시료는 다음과 같다: (레인 1) MW 마커; (2) 대조군; (3) pTT3 pfu lon HL(-); 및 (4) pTT3 pfu lon MutA.
도 5는 klbA 인테인을 사용하여 sORF 작제물로부터 생산된 분비된 항체의 분석을 나타낸다. Pab-klbA HL(-) 및 Mja-klbA HL(-) 작제물로부터 분비된 IgG 생성물을 단백질 A 친화성 크로마토그래피로 정제하고 환원(패널 A, B, 및 C) 및 비-환원(패널 D) 조건하에 SDS-PAGE로 분리하였다. 패널 A 및 D는 염색된 겔의 영상을 나타내고; 패널 B는 사람 IgG1 Fc에 대한 항체를 사용한 면역블롯이며; 패널 C는 사람 카파 경쇄에 대한 항체를 사용한 면역블롯이다. 좌측으로부터 우측까지의 레인 및 시료는 다음과 같다: (레인 1) 대조군; (2) Pab-klbA HL(-); 및 (3) Mja-klbA HL(-). 대조군은 2개의 별개의 전사 해독 프레임의 발현으로부터 생산된 동일한 항체이다.
도 6은 N-말단 스플라이싱 연결부에서 아미노산 잔기에 대한 변형을 지닌 Pab klbA 인테인을 사용한 단일의 전사 해독 프레임 작제물의 발현 결과를 나타낸다. 분비된 IgG 단백질은 단백질 A 친화성 크로마토그래피로 정제하고 SDS-PAGE에 의해 비-환원 및 환원 조건하에서 분리하였다. 좌측으로부터 우측까지의 레인 및 시료는 다음과 같다: (레인 1) MW 마커; (2) 통상의 벡터(대조군)를 사용하여 생산된 동일한 항체; (3) pTT3 Pab klba HL(-)wt; (4) pTT3 Pab klba HL(-)GC; 및 (5) pTT3 Pab klba HL(-)KC.
도 7은 CHO 세포주 시스템에서 안정한 발현 벡터로 사용하기 위해 조정된, sORF 발현 작제물, pA190-Pab-lon HL(-)의 개략도를 나타낸다.
도 8은 sORF 작제물 형질감염 클론(sORF Pab lon 작제물)의 안정한 발현 시스템에 대한 배양 합치성(confluency)에 도달하는 시간 및 빈도의 결과를 나타낸다.
도 9는 경쇄 연결부 돌연변이를 갖는 일시적인 발현 작제물의 sORF 성분들에 대한 구조의 개략도를 나타낸다. 일련의 작제물은 "M1-X"(제1 주(first line)) 및 D2-X"(제2 주)로 지정하며 여기서, X는 임의의 아미노산을 나타낸다.
도 10는 Met1 잔기의 변이를 기준으로 한 경쇄 연결부 돌연변이를 갖는 일련의 sORF 작제물에 대한 IgG 분비 결과를 나타낸다.
도 11은 Asp2 잔기의 변이를 기준으로 한 경쇄 연결부 돌연변이를 갖는 일련의 sORF 작제물에 대한 IgG 분비 결과를 나타낸다.
도 12는 경쇄 연결부 돌연변이를 갖는 Met1 및 Asp2 일련의 작제물 각각의 예로부터의 단백질 생성물에 대한 SDS-PAGE 분석의 결과를 나타낸다.
도 13은 ABT-874 항체를 발현할 수 있는 일시적인 발현 작제물의 sORF 성분들에 대한 구조의 개략도를 나타낸다.
도 14는 태그(tag)를 포함하는 삽입체의 도입을 위한 용매가 접근가능한 루프(loop)의 바람직한 위치(DOD 엔도뉴클레아제 도메인의 말단에 대해, 분절 H 및 F의 인근 연결부를 지적하는 빗금 화살표)의 위치와 관련하여 인테인의 특정 구조 모티프를 나타낸다.
도 15는 HEK293 세포의 일시적인 형질감염 시스템에서 사용하기 위한 경쇄 시그날 펩타이드 A18을 지닌 발현 작제물의 플라스미드 맵을 나타낸다.
도 16은 항체 발현 작제물의 생성물의 SDS-PAGE 분석의 결과를 나타낸다.
도 17은 일시적으로 감염된 HEK293 세포 및 안정하게 형질감염된 CHO 세포를 포함하는 형질감염된 세포주로부터 항체 발현 작제물의 생성물의 웨스턴 블롯 분석의 결과를 나타낸다.
도 18은 CHO 세포의 안정한 형질감염 시스템에서 사용하기 위한 경쇄 시그날 펩타이드 A18을 사용한 발현 작제물의 플라스미드 맵을 나타낸다.
1 shows a schematic of the sORF expression construct, pTT3 pab lon HL (−).
2 shows the structure of the sORF components in the expression construct for the D2E7 antibody.
3 shows the results of SDS-PAGE for protein analysis of sORF expression products. Secreted IgG molecules are purified by Protein A affinity chromatography and separated by SDS-PAGE under non-reducing (A) and reducing (B) conditions. Lanes and samples from left to right are as follows: (lane 1) MW reference marker; (2) control construct products; (3) Pab-lon mut A1; (4) Pab-lon mut A2; (5) pTT3 pfu lon YP, and (6) pTT3 pfu lon MA.
4 shows the results of SDS-PAGE for protein analysis of additional sORF expression products. Secreted IgG was purified by Protein A affinity chromatography and separated by SDS-PAGE under non-reducing (A) and reducing (B) conditions. Lanes and samples from left to right are as follows: (lane 1) MW marker; (2) control; (3) pTT3 pfu lon HL (−); And (4) pTT3 pfu lon MutA.
5 shows analysis of secreted antibodies produced from sORF constructs using the klbA intein. IgG products secreted from Pab-klbA HL (-) and Mja-klbA HL (-) constructs were purified by Protein A affinity chromatography and reduced (panels A, B, and C) and non-reduced (Panel D) It was separated by SDS-PAGE under the conditions. Panels A and D show images of stained gels; Panel B is an immunoblot using an antibody against human IgG1 Fc; Panel C is an immunoblot using antibodies against human kappa light chains. Lanes and samples from left to right are as follows: (lane 1) control; (2) Pab-klbA HL (-); And (3) Mja-klbA HL (-). The control is the same antibody produced from the expression of two separate transcription translation frames.
FIG. 6 shows the results of expression of a single transcriptional translation frame construct using Pab klbA intein with modifications to amino acid residues at the N-terminal splicing junction. Secreted IgG proteins were purified by Protein A affinity chromatography and separated under non-reducing and reducing conditions by SDS-PAGE. Lanes and samples from left to right are as follows: (lane 1) MW marker; (2) the same antibody produced using a conventional vector (control); (3) pTT3 Pab klba HL (−) wt; (4) pTT3 Pab klba HL (-) GC; And (5) pTT3 Pab klba HL (-) KC.
7 shows a schematic of the sORF expression construct, pA190-Pab-lon HL (−), adapted for use as a stable expression vector in the CHO cell line system.
8 shows the results of time and frequency of reaching culture consensus for a stable expression system of sORF construct transfection clone (sORF Pab lon construct).
9 shows a schematic of the structure for the sORF components of the transient expression construct with light chain linkage mutations. The series of constructs is designated "M1-X" (first line) and D2-X "(second week), where X represents any amino acid.
FIG. 10 shows IgG secretion results for a series of sORF constructs with light chain linkage mutations based on variations in Met1 residues.
11 shows IgG secretion results for a series of sORF constructs with light chain linkage mutations based on mutations in the Asp2 residue.
12 shows the results of SDS-PAGE analysis of protein products from examples of each of the Met1 and Asp2 series of constructs with light chain linkage mutations.
13 shows a schematic of the structure for the sORF components of a transient expression construct capable of expressing ABT-874 antibodies.
FIG. 14 shows hatched lines indicating the adjacent connections of segments H and F, relative to the end of the DOD endonuclease domain where the solvent is accessible for the introduction of an insert comprising a tag. The specific structural motif of the intein in relation to the position of the arrow).
15 shows a plasmid map of expression constructs with light chain signal peptide A18 for use in a transient transfection system of HEK293 cells.
16 shows the results of SDS-PAGE analysis of the product of antibody expression constructs.
17 shows the results of Western blot analysis of the product of antibody expression constructs from transfected cell lines comprising transiently infected HEK293 cells and stably transfected CHO cells.
18 shows a plasmid map of expression constructs using light chain signal peptide A18 for use in a stable transfection system of CHO cells.

발명의 상세한 설명DETAILED DESCRIPTION OF THE INVENTION

본 발명은 다음의 비-제한적 실시예에 의해 추가로 이해될 수 있다.The invention can be further understood by the following non-limiting examples.

특정 정보는 2007년 3월 22일자로 카슨(Carson) 등에 의해 제US 20070065912호에 따른 것을 포함하는, 당해 분야에서의 기재에 의해 인식될 것이다.Certain information will be recognized by the description in the art, including those according to US 20070065912, issued March 22, 2007 by Carson et al.

본 발명은 효소, 호르몬(예를 들면, 인슐린), 사이토킨, 케모킨, 수용체, 항체 또는 다른 분자와 같은 생물학적으로 활성인 단백질 또는 화합물 구조의 발현을 위한 시스템, 예를 들면, 작제물 및 방법을 제공한다. 바람직하게는, 단백질은 인터루킨, 완전한 길이의 면역글로불린과 같은 면역조절 단백질, 이의 단편, 당해 분야에서 이해되는 바와 같은 다른 항원 인식 분자, 또는 다른 생물치료학적 분자이다. 이러한 시스템의 개관은 면역글로불린 분자의 특이적인 내용에 있으며, 여기서, 재조합체 생산은 단일 프로모터의 전사 제어하에서 경쇄 및 중쇄 암호화 서열의 발현을 기초로 하고, 여기서, 단일의 해독 생성물(폴리프로테인)의 별개의 중쇄 및 경쇄로의 전환은 인테인 성분에 의해 매개된다.The present invention provides systems, e.g., constructs and methods for the expression of biologically active protein or compound structures such as enzymes, hormones (e.g. insulin), cytokines, chemokines, receptors, antibodies or other molecules. to provide. Preferably, the protein is an interleukin, an immunoregulatory protein such as a full length immunoglobulin, a fragment thereof, another antigen recognition molecule as understood in the art, or other biotherapeutic molecule. An overview of this system is in the specific context of immunoglobulin molecules, where recombinant production is based on the expression of light and heavy chain coding sequences under the transcriptional control of a single promoter, where a single translational product (polyprotein) Conversion to separate heavy and light chains is mediated by intein components.

하나의 양태에서, 면역글로불린 폴리프로테인 분자의 제1 또는 제2의 쇄는 중쇄 또는 경쇄일 수 있다. 재조합체 면역글로불린 분절을 암호화하는 서열은 완전한 길이의 암호화 서열 또는 이의 단편일 수 있다. 구체적인 양태에서, 제2의 경쇄 암호화 서열은 본 발명의 실시에서 프로세싱될 폴리프로테인을 암호화하는 서열의 일부이어야 하며, 즉, 2개의 경쇄 및 1개의 중쇄를 어떠한 순서로 포함하는 3개의 분절이 존재함을 고려하여야 한다. 특수 양태에서, 작제물은 이들 성분들로 및 다음 순서: a) IgH-IgL; b) IgL-IgH; c) IgH-IgL-IgL; d) IgL-IgH-IgL; e) IgL-IgL-IgH; f) IgH-IgH-IgL; g) IgH-IgL-IgH; 및/또는 h) IgL-IgH-IgH로 구성된다. 하나의 양태에서, 상기 하이픈은 절단 부위 서열이 위치하는 위치를 나타낼 수 있다. In one embodiment, the first or second chain of an immunoglobulin polyprotein molecule may be heavy or light chain. The sequence encoding the recombinant immunoglobulin segment may be a full length coding sequence or fragment thereof. In a specific embodiment, the second light chain coding sequence should be part of the sequence encoding the polyprotein to be processed in the practice of the present invention, ie there are three segments in any order comprising two light chains and one heavy chain. Consideration should be given. In a particular embodiment, the construct consists of these components and in the following order: a) IgH-IgL; b) IgL-IgH; c) IgH-IgL-IgL; d) IgL-IgH-IgL; e) IgL-IgL-IgH; f) IgH-IgH-IgL; g) IgH-IgL-IgH; And / or h) IgL-IgH-IgH. In one embodiment, the hyphen can indicate where the cleavage site sequence is located.

또한, 면역글로불린 중쇄 및 경쇄 암호화 서열이 이들 사이의 인테인 암호화 서열에 대해 프레임 내로(in frame) 융합되며, 여기서 인테인은 설계된 중쇄 및 경쇄의 말단 또는 스플라이싱 활성(splicing activity)을 결여하도록 변형되거나 천연적으로 이것이 가능하여 스플라이싱이 바람직하게는 발생하지 않거나 또는 스플라이싱이 불량한 효율로 발생하여 스플라이싱되지 않은 항체 분자가 우세해지도록 할 수 있다. 또한, 변형된 인테인은 여전히 추가로 변형됨으로써 엔도뉴클레아제 영역(여기서 엔도뉴클레아제 영역은 이미 존재한다)이 존재하지 않을 수 있으며, 단, 부위 특이적인 단백질분해 절단 활성은 잔존하여 경쇄 및 중쇄 항체 폴리펩타이드가 주요 해독 생성물의 개재 인테인 부분으로부터 유리된다. 경쇄 또는 중쇄 항체 폴리펩타이드 중의 어느 하나는 N-엑스테인일 수 있으며, C-엑스테인일 수 있다.In addition, immunoglobulin heavy and light chain coding sequences are fused in frame to the intein coding sequence therebetween, wherein the intein is devoid of terminal or splicing activity of the designed heavy and light chains. This can be modified or naturally possible so that splicing preferably does not occur or splicing occurs with poor efficiency so that unspliced antibody molecules predominate. In addition, the modified inteins may still be further modified such that the endonuclease region (where the endonuclease region already exists) does not exist, provided site-specific proteolytic cleavage activity remains so that the light chain and Heavy chain antibody polypeptides are liberated from intervening intein portions of the main translation product. Either light or heavy chain antibody polypeptide can be N-extein and C-extein.

벡터는 완전한 길이의 폴리프로테인을 발현할 수 있는 어떠한 재조합체 벡터, 예를 들면, 아데노-관련 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 복제 상보체 아데노바이러스 벡터, 복제 결핍성 아데노바이러스 벡터 및 무기력한(gutless) 아데노바이러스 벡터, 헤르페스 바이러스 벡터 또는 비바이러스 벡터(플라스미드) 또는 당해 분야에 공지된 어떠한 다른 벡터일 수 있으며, 여기서 면역글로불린 또는 다른 단백질(들)이 발현된 숙주 세포에 대해 적절한 벡터를 선택한다. 바큘로바이러스 벡터는 곤충 세포내 유전자의 발현에 사용가능하다. 다수의 벡터가 당해 분야에 공지되어 있으며, 많은 것이 시판되거나 달리는 당해 분야에 용이하게 접근가능하다.The vector may be any recombinant vector capable of expressing a full length polyprotein, such as an adeno-associated virus (AAV) vector, a lentiviral vector, a retroviral vector, a replica complement adenovirus vector, a replication deficient adenovirus Vector and gutless adenovirus vector, herpes virus vector or non-viral vector (plasmid) or any other vector known in the art, wherein the immunoglobulin or other protein (s) is expressed on a host cell. Choose the appropriate vector. Baculovirus vectors can be used for expression of genes in insect cells. Many vectors are known in the art and many are readily accessible in the art, either commercially available or otherwise.

프로모터를 포함하는 조절 서열; 숙주 세포Regulatory sequences, including promoters; Host cell

재조합체 면역글로불린 또는 다른 단백질 발현을 위한 벡터는 당해 분야에 공지된 다수의 프로모터 중 어느 것도 포함할 수 있으며, 여기서, 프로모터는 구성적이거나, 조절가능하거나 유도성이거나, 세포 유형 특이적이거나, 조직-특이적이거나 또는 종 특이적이다. 추가의 구체적인 예는 예를 들면, 테트라사이클린-반응성 프로모터[참조: Gossen M, Bujard H, Proc Natl Acad Sci U S A. 1992, 15;89(12):5547-51]를 포함한다. 벡터는 숙주 세포에 대해 조정된 레플리콘(replicon)이며, 여기서 키메라 유전자가 발현되어야 하며, 이는 또한 세균 세포, 및 유리하게는, 분자 생물학적 조작에 편리한 세포인, 에스케리키아 콜라이(Escherichia coli)내에서 레플리콘 기능을 포함하는 것이 바람직하다.Vectors for recombinant immunoglobulin or other protein expression can include any of a number of promoters known in the art, wherein the promoter is constitutive, controllable or inducible, cell type specific, or tissue It is specific or species specific. Further specific examples include, for example, tetracycline-reactive promoters (Gossen M, Bujard H, Proc Natl Acad Sci US A. 1992, 15; 89 (12): 5547-51). Vector is a replicon (replicon) adjusted for the host cell, wherein the chimeric gene to be expressed, which is also a bacterial cell, and advantageously, a convenient cell for molecular biological manipulation, Escherichia coli (Escherichia coli ) in the presence of a replicon function.

유전자 발현을 위한 숙주 세포는 이에 한정되지 않는 동물 세포, 특히, 포유동물 세포일 수 있거나, 이는 미생물 세포(세균, 효모, 진균, 그러나 바람직하게는 진핵세포) 또는 식물 세포일 수 있다. 특히 적합한 숙주 세포는 스포도프테라 프루기페르다(Spodoptera frugiperda) 세포와 같은 곤충 배양된 세포, 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 또는 피키아 파스토리스(Pichia pastoris)와 같은 효모 세포, 트리코데르마 레에세이(Trichoderma reesei), 아스퍼길러스(Aspergillus), 아우레오바시둠(Aureobasidum) 및 페니실리움(Penicillium) 종과 같은 진균, 및 CHO(차이니즈 햄스터 난소), BHK(햄스터 새끼 신장), COS, 293, 3T3(마우스), Vero(아프리카 녹색 원숭이) 세포와 같은 포유동물 세포를 포함하며, 돼지, 마우스, 랫트, 양, 염소, 소를 포함하나 이에 한정되지 않는 각종의 유전자이식 동물 시스템 또한 사용될 수 있다. 난백 및 유전자이식 양, 염소 및 소 시스템에서 발현을 위한 닭 시스템은 다른 것들 중에서도 우유에서 발현을 위해 공지되어 있다. 바큘로바이러스, 특히 AcNPV 벡터는 예를 들면, 곤충 세포주에서 폴리헤드린 프로모터 또는 다른 강력한 프로모터의 조절성 제어하에 sORF의 발현을 사용하여 단일의 ORF 항체 발현 및 본 발명의 절단에 사용될 수 있으며, 이런 벡터 및 세포주는 당해 분야에 익히 공지되어 있고 시판되고 있다. 포유동물 세포에서 사용된 프로모터는 구성적(헤르페스 바이러스 TK 프로모터, 참조: McKnight, 세포 31 :355, 1982; SV40 얼리 프로모터(early promoter), 참조: Benoist et al. Nature 290:304, 1981, 라우스 육종 바이러스(Rous sarcoma virus) 프로모터, 참조: Gorman et al. Proc. Natl. Acad. Sci. USA 79:6777, 1982; 사이토메갈로바이러스 프로모터, 참조: Foecking et al. Gene 45:101, 1980; 마우스 유방 종양 바이러스 프로모터, 일반적으로 참조: Etcheverry in Protein Engineering: Principles and Practice, Cleland et al ., eds, pp.162-181 , Wiley & Sons, 1996)일 수 있거나 또는 조절된다(메탈로티오네인 프로모터, 예를 들면, 참조: Hamer et al. J. Molec. Appl. Genet. 1:273, 1982). 벡터는 특수한 포유동물 세포를 감염시키는 바이러스, 특히 레트로바이러스, 박시니아(vaccinia) 및 아데노바이러스를 기초로 할 수 있으며 이들의 유도체는 당해 분야에 공지되어 있고 시판된다. 프로모터는 사이토메갈로바이러스, 아데노바이러스 레이트, 및 박시니아 7.5K 프로모터를 포함하나, 이에 한정되지 않는다. 효모 및 진균 벡터[참조: 예를 들면, Van den Handel, C. et al. (1991) In: Bennett, J.W. and Lasure, L.L. (eds.), More Gene Manipulations in Fungi, Academy Press, Inc., New York, 397-428] 및 프로모터는 또한 잘 공지되어 있으며 광범위하게 사용가능하다. 에놀라제는 잘 공지된 구성적 효모 프로모터이며, 알코올 데하이드로게나제는 잘 공지된 조절된 프로모터이다.The host cell for gene expression can be an animal cell, in particular a mammalian cell, but not limited to, or it can be a microbial cell (bacteria, yeast, fungus, but preferably eukaryotic) or plant cell. Particularly suitable host cells are Spodoptera Insect cultured cells, such as frugiperda ) cells, Saccharomyces yeast cells, such as cerevisiae or Pichia pastoris , Trichoderma fungi such as reesei , Aspergillus , Aureobasidum and Penicillium species, and CHO (Chinese hamster ovary), BHK (hamster cub kidney), COS, 293, 3T3 ( Various transgenic animal systems, including but not limited to mammalian cells, such as mice), Vero (African green monkey) cells, and pigs, mice, rats, sheep, goats, and cattle. Chicken systems for expression in egg white and transgenic sheep, goat and bovine systems are known for expression in milk, among others. Baculoviruses, in particular AcNPV vectors, can be used for expression of single ORF antibodies and cleavage of the invention using, for example, the expression of sORF under the regulatory control of polyhedrin promoters or other potent promoters in insect cell lines. And cell lines are well known in the art and commercially available. Promoters used in mammalian cells are constitutive (herpes virus TK promoter, see McKnight, cells 31: 355, 1982; SV40 early promoter, see Benoist et al. Nature 290: 304, 1981, Raus sarcoma Virus sarcoma virus promoter, Gorman et al. Proc. Natl. Acad. Sci. USA 79: 6777, 1982; cytomegalovirus promoter, Foecking et al. Gene 45: 101, 1980; mouse breast tumors Viral promoter, generally see Etcheverry in Protein Engineering: Principles and Practice, Cleland et al., Eds, pp. 162-181, Wiley & Sons, 1996) or may be regulated (metallothionein promoter, for example See, for example, Hamer et al. J. Molec. Appl. Genet. 1: 273, 1982). Vectors can be based on viruses that infect specific mammalian cells, in particular retroviruses, vaccinia and adenoviruses and derivatives thereof are known in the art and commercially available. Promoters include, but are not limited to, cytomegalovirus, adenovirus rate, and baccinia 7.5K promoter. Yeast and fungal vectors [see, eg, Van den Handel, C. et al. (1991) In: Bennett, JW and Lasure, LL (eds.), More Gene Manipulations in Fungi, Academy Press, Inc., New York, 397-428, and promoters are also well known and widely available. Enolase is a well known constitutive yeast promoter and alcohol dehydrogenase is a well known regulated promoter.

특이적인 프로모터, 전사 종결 서열 및 다른 임의의 서열, 예를 들면, 조직 특이적인 서열을 암호화하는 서열의 선택은, 발현이 바람직한 세포의 유형에 의해 대부분 결정될 것이다. 이는 세균, 효모, 진균, 포유동물, 곤충, 닭 또는 다른 동물 세포일 수 있다.The selection of specific promoters, transcription termination sequences and any other sequences, such as sequences encoding tissue specific sequences, will largely be determined by the type of cell in which expression is desired. It may be a bacterial, yeast, fungal, mammalian, insect, chicken or other animal cell.

시그날Signal 서열 order

벡터내로 혼입된, 절단되거나, 단백질분해적으로 프로세싱되거나 자가 프로세싱될 단백질의 암호화 서열은 또한 하나 이상의 시그날 서열을 암호화하는 하나 이상의 서열을 추가로 포함할 수 있다. 이들 암호화된 시그날 서열은 폴리프로테인내 성숙한 분절 하나 이상과 연합될 수 있다. 예를 들면, 면역글로불린 중쇄 리더 서열을 암호화하는 서열은 폴리프로테인 암호화 서열의 나머지와 프레임(frame)내에서 및 작동적으로 연결된, 중쇄에 대한 암호화 서열의 앞에 있을 수 있다. 유사하게, 경쇄 리더 펩타이드 암호화 서열 또는 다른 리더 펩타이드 암호화 서열은 면역글로불린 경쇄 암호화 서열 중 하나 또는 둘다와, 자가-프로세싱 부위(예를 들어, 2A)로부터 인접한 쇄에 의해 또는 프로테아제 인식 서열을 암호화하는 서열에 의해 분리되는 리더 서열-쇄와 함께, 적절한 판독 프레임이 유지되면서 프레임내에서 연합될 수 있다.The coding sequence of the protein to be cleaved, proteolytically processed or self processed into a vector may further comprise one or more sequences encoding one or more signal sequences. These encoded signal sequences may be associated with one or more mature segments in the polyprotein. For example, the sequence encoding the immunoglobulin heavy chain leader sequence may precede the coding sequence for the heavy chain, in frame and operatively linked with the rest of the polyprotein coding sequence. Similarly, the light chain leader peptide coding sequence or other leader peptide coding sequence may comprise one or both of an immunoglobulin light chain coding sequence and a sequence encoding a protease recognition sequence or by an adjacent chain from a self-processing site (eg 2A). With the leader sequence-chain separated by, an appropriate read frame can be associated within the frame while maintaining an appropriate reading frame.

면역글로불린 중쇄 및 경쇄의 화학량론Stoichiometry of immunoglobulin heavy and light chains

본원의 많은 양태들에서, 면역글로불린/항체 경쇄(IgL) 및 중쇄(IgH)는 벡터 수준에서 또는 숙주 세포내에서 발현된 세포내 수준에서 약 1:1 비(IgL:IgH)로 존재한다. 한편, 본원 및 다른 문헌의 재조합체 시도는 중쇄 및 경쇄의 등몰 발현(equimolar expression)에 의존하며(참조: 예를 들면, 미국 특허 공보 제2005/0003482A1호 또는 국제 공보 제WO2004/113493호), 다른 양태에서, 본 발명은, 주요 해독 생성물이 폴리프로테인인 경우 쇄의 자가-프로세싱 또는 단백질분해 프로세싱으로 공-발현되고 2:1 비의 경쇄 및 중쇄 암호화 서열을 사용하는 방법 및 발현 카세트 및 벡터를 제공한다. 양태들에서, 당해 비는 약 2:1 또는 2:1 초과와 같은 1:1 초과이다. 특수 양태에서, 경쇄 암호화 서열은 1:1(IgL:IgH) 초과의 비로 사용된다. 구체적인 양태에서, IgL:IgH의 비는 2:1이다. 따라서, 양태들에서, sORF 항체 발현 기술에 의해 제공된 장점은 중쇄 및 경쇄에 대한 유전자 용량비를 조작하는 능력, ER내에서 다중-소단위 조립을 위한 중쇄 및 경쇄 폴리펩타이드의 근접성, 및 고 효율 단백질 분비를 위한 잠재성을 포함한다.In many of the embodiments herein, the immunoglobulin / antibody light chain (IgL) and heavy chain (IgH) are present at about a 1: 1 ratio (IgL: IgH) at the vector level or at the intracellular level expressed in the host cell. Meanwhile, recombinant attempts herein and in other documents rely on equimolar expression of heavy and light chains (see, eg, US Patent Publication No. 2005 / 0003482A1 or International Publication No. WO2004 / 113493). In an aspect, the invention provides methods and expression cassettes and vectors that co-express by chain self-processing or proteolytic processing when the main translation product is a polyprotein and uses a 2: 1 ratio of light and heavy chain coding sequences do. In embodiments, the ratio is greater than 1: 1, such as about 2: 1 or greater than 2: 1. In a particular embodiment, the light chain coding sequences are used in ratios greater than 1: 1 (IgL: IgH). In a specific embodiment, the ratio of IgL: IgH is 2: 1. Thus, in embodiments, the advantages provided by the sORF antibody expression technique include the ability to manipulate gene dose ratios for heavy and light chains, the proximity of heavy and light chain polypeptides for multi-subunit assembly in the ER, and high efficiency protein secretion. Include potential for

본 발명은 면역글로불린(즉, 항체)의 중쇄 및 하나 또는 적어도 2개의 경쇄를 암호화하는 서열; 이들 사이에 존재하는 자가-프로세싱, 프로테아제 인식 부위 또는 시그날 펩타이드와 같은 절단 부위를 암호화하는 서열을 포함하는 벡터로 형질전환되거나 감염된 숙주 세포 또는 숙주 세포의 안정한 클론을 추가로 제공하며; 추가의 단백질분해 절단 부위를 암호화하는 서열 또는 서열들을 추가로 포함할 수 있다. 또한, 다중 소단위(예를 들면, 2-쇄 또는 다중-쇄 분자 또는 전구-단백질로서 천연적으로 생산되고 전구체-기원한 단백질 및 활성 부분을 방출하도록 절단되거나 프로세싱되는 것들)로 구성된 완전한 길이의 재조합체 면역글로불린 또는 이의 단편 또는 다른 생물학적으로 활성인 단백질을 생성하는데 있어서 이러한 세포 또는 클론의 용도가 본 발명의 범위에 포함된다. 비-제한적 예는 인슐린, 인터루킨-18, 인터루킨-1 , 골 형태발생 단백질 4, 골 형태발생 단백질 2, 어떠한 다른 2 쇄 골 형태발생 단백질, 신경 성장 인자, 레닌, 키모트립신, 형질전환 성장 인자 β, 및 인터루킨 1β를 포함한다.The present invention provides a sequence encoding a heavy chain and one or at least two light chains of an immunoglobulin (ie, an antibody); Further providing a stable clone of a host cell or host cell transformed or infected with a vector comprising a sequence encoding a cleavage site, such as a self-processing, protease recognition site or signal peptide present between them; It may further comprise a sequence or sequences encoding additional proteolytic cleavage sites. In addition, full-length recombination consisting of multiple subunits (eg, those that are naturally produced as two-chain or multi-chain molecules or pro-proteins and that are cleaved or processed to release precursor-derived proteins and active moieties) The use of such cells or clones in producing somatic immunoglobulins or fragments thereof or other biologically active proteins is within the scope of the present invention. Non-limiting examples include insulin, interleukin-18, interleukin-1, bone morphogenic protein 4, bone morphogenic protein 2, any other two clavicle morphogenic proteins, nerve growth factor, renin, chymotrypsin, transforming growth factor β , And interleukin 1β.

관련 국면에서, 본 발명은 재조합체 면역글로불린 분자 또는 이의 단편, 또는 이러한 세포 또는 클론에 의해 생산된 다른 단백질을 제공하며, 여기서 면역글로불린은 자가 프로세싱 절단 부위[예를 들면, 인테인 또는 헷지훅(hedgehog) 도메인], 절단 부위 또는 시그날 펩타이드 절단 및 이를 생산하는 방법, 벡터 및 숙주 세포로부터 기원한 아미노산을 포함한다. 양태들에서, 본 발명은 본원에 기술된 바와 같은 하나 이상의 작제물을 함유하는 숙주 세포를 제공한다.In a related aspect, the present invention provides recombinant immunoglobulin molecules or fragments thereof, or other proteins produced by such cells or clones, wherein the immunoglobulins are self-processing cleavage sites [eg, intein or hedgehook ( hedgehog) domains], cleavage sites or signal peptide cleavage and methods of producing the same, and amino acids derived from vectors and host cells. In aspects, the present invention provides a host cell containing one or more constructs as described herein.

본 발명은 면역글로불린 분자 또는 이의 단편의 발현을 위한 단일 벡터 작제물 및 이의 시험관내 또는 생체내 사용 방법을 제공한다. 벡터는 제1과 제2 면역글로불린 암호화 서열 사이 및 제2와 제3 면역글로불린 암호화 서열 사이의 자가-프로세싱 또는 다른 프로테아제 인식 서열들을 가짐으로써 단일 프로모터 및 전사체를 사용한 기능성 항체 분자의 발현을 허용한다. 예시적인 벡터 작제물은 전사 해독 프레임들 사이의 자가-프로세싱 절단 부위를 암호화하는 서열을 포함하며 또한 절단 다음의 자가-프로세싱 절단 부위를 포함하는 아미노산의 제거를 위한 자가-프로세싱 절단 부위에 근접한 추가의 단백질 분해 절단 부위를 포함할 수 있다. 벡터 작제물은 시험관내 및 생체내에서 완전한 길이의 생물학적으로 활성인 면역글로불린 또는 이의 단편의 향상된 생산과 관련된 방법에서의 유용성이 밝혀져 있다. 적어도 2개의 상이한 쇄를 갖는 다른 생물학적으로 활성인 단백질은, 비록 쇄의 암호화 서열이 다른 쇄의 암호화 서열에 대해 1 초과의 비로 존재하는 것이 요구되지 않을 수 있음이 이해된다고 해도, 동일한 전략을 사용하여 제조할 수 있다.The present invention provides single vector constructs for the expression of immunoglobulin molecules or fragments thereof and methods of using them in vitro or in vivo. The vector allows for expression of functional antibody molecules using a single promoter and transcript by having self-processing or other protease recognition sequences between the first and second immunoglobulin coding sequences and between the second and third immunoglobulin coding sequences. . Exemplary vector constructs include a sequence encoding a self-processing cleavage site between transcription translation frames and further adjacent to the self-processing cleavage site for removal of amino acids comprising the self-processing cleavage site following cleavage. Proteolytic cleavage sites. Vector constructs have been found to be useful in methods involving enhanced production of full length biologically active immunoglobulins or fragments thereof in vitro and in vivo. Other biologically active proteins having at least two different chains may be employed using the same strategy, although it is understood that the coding sequences of the chains may not be required to be present in more than one ratio relative to the coding sequences of the other chains. It can manufacture.

비록 특수 조성물 및 방법이 본원에 예시되어 있다고 해도, 다수의 대안적인 조성물 및 방법 중 어느 것도 적용가능하며 본 발명을 실시하는데 사용하기에 적합함이 이해된다. 본 발명의 폴리프로테인 발현 카세트 및 벡터, 숙주 세포 및 방법의 평가가 당해 분야의 과정 표준을 사용하여 수행될 수 있음이 또한 이해될 것이다. 본 발명의 실시는 달리 나타내지 않는 한, 당해 분야의 숙련가의 영역내에 있는, 세포 생물학, 분자 생물학(재조합 기술 포함), 미생물학, 생화학 및 면역학의 통상의 기술을 사용할 것이다. 이러한 기술은, 이들 각각 본원에 참조로 표현하여 인용된 문헌[참조: Molecular Cloning: A Laboratory Manual, second edition (Sambrook et al., 1989); Oligonucleotide Synthesis (M. J. Gait, ed., 1984); Animal Cell Culture (R. I. Freshney, ed., 1987); Methods in Enzymology (Academic Press, Inc.); Handbook of Experimental Immunology (D. M. Weir & C. C. Blackwell, eds.); Gene Transfer Vectors for Mammalian Cells (J. M. Miller & M. P. Calos, eds., 1987); Current Protocols in Molecular Biology (F. M. Ausubel et al., eds., 1993); PCR: The Polymerase Chain Reaction, (Mullis et al., eds., 1994); and Current Protocols in Immunology (J. E. Coligan et al., eds., 1991]과 같은 문헌에 충분히 설명되어 있다.Although special compositions and methods are illustrated herein, it is understood that any of a number of alternative compositions and methods are applicable and suitable for use in practicing the present invention. It will also be appreciated that the evaluation of polyprotein expression cassettes and vectors, host cells and methods of the invention can be performed using process standards in the art. The practice of the present invention will employ, unless otherwise indicated, conventional techniques of cell biology, molecular biology (including recombination techniques), microbiology, biochemistry and immunology, which are within the scope of those skilled in the art. Such techniques are described in Molecular Cloning: A Laboratory Manual, second edition (Sambrook et al., 1989), each of which is hereby incorporated by reference; Oligonucleotide Synthesis (M. J. Gait, ed., 1984); Animal Cell Culture (R. I. Freshney, ed., 1987); Methods in Enzymology (Academic Press, Inc.); Handbook of Experimental Immunology (D. M. Weir & C. C. Blackwell, eds.); Gene Transfer Vectors for Mammalian Cells (J. M. Miller & M. P. Calos, eds., 1987); Current Protocols in Molecular Biology (F. M. Ausubel et al., Eds., 1993); PCR: The Polymerase Chain Reaction, (Mullis et al., Eds., 1994); and Current Protocols in Immunology (J. E. Coligan et al., eds., 1991).

달리 나타내지 않는 한, 본원에 사용된 모든 용어들은 당해 분야의 숙련가에 게 이해되는 바와 동일한 의미를 가지며, 본 발명의 실시는 당해 분야의 숙련가의 지식내에 있는, 미생물학 및 재조합 DNA 기술의 통상의 기술을 사용할 것이다.Unless otherwise indicated, all terms used herein have the same meaning as is understood by one of ordinary skill in the art, and the practice of the present invention refers to conventional techniques of microbiology and recombinant DNA technology, which are within the knowledge of those skilled in the art. will use it.

단백질과 관련하여 본원에 일반적으로 사용된 용어 "변형된"은, 적어도 하나의 아미노산 잔기가 참조된 분자내에서 치환되거나, 이로부터 결실되거나 이에 첨가된 분절(segment)을 말한다. 유사하게, 핵산과 관련하여, 용어는, 적어도 하나의 핵산 소단위가 참조된 분자내에서 치환되거나, 이로부터 결실되거나, 이에 첨가된 분절을 말한다.The term “modified,” as used herein generally in reference to a protein, refers to a segment in which at least one amino acid residue is substituted, deleted from, or added to the referenced molecule. Similarly, in the context of nucleic acids, the term refers to a segment in which at least one nucleic acid subunit has been substituted, deleted from, or added to a referenced molecule.

본원에 사용된 것으로서 용어 "인테인"은 전형적으로 이의 자체의 제거를 촉진하고 엑스테인(extein)으로 공지된 플랭킹 분절(flanking segment)의 연결에 영향을 미치는 단백질의 내부 분절을 말한다. 인테인의 많은 예가 일부 경우에 공유된 구조적 및/또는 기능적 특징과 함께, 각종 유형의 유기체내에서 인식된다. 본 발명은 존재하는 것으로 인정되고 추가로 인식되거나 발견되는, 인테인, 및 이의 변이체를 광범위하게 사용할 수 있다[참조: 예를 들면, Gogarten JP et al., 2002, Annu Rev Microbiol. 2002;56:263-87; Perler, F. B. (2002), InBase, the Intein Database. Nucleic Acids Res. 30, 383-384(또한 인터넷을 통해 매사추세츠주 입스위치(Ipswich) 소재의 뉴 잉글랜드 바이오랩스, 인코포레이티드(New England Biolabs, Inc.)의 웹사이트에서; http://www.neb.com/neb/inteins.html; Amitai G, et al., Mol Microbiol. 2003, 47(1):61-73; Gorbalenya AE, Nucleic Acids Res. 1998; 26(7): 1741 -1748. Non-canonical inteins]. 단백질에서 인테인-함유 단위 또는 인테인 스플라이싱 단위는 플랭킹 엑스테인의 일부를 포함하는 것으로 이해될 수 있으며, 여기서 구조적 국면은 절단, 연결 등의 반응에 기여할 수 있다. 용어는 또한 "변형된 인테인" 성분을 지닌 인테인-계 시스템을 언급하는데 있어서 범주로 이해될 수 있다.As used herein, the term “intein” refers to an internal segment of a protein that typically facilitates its removal and affects the ligation of the flanking segment known as extein. Many examples of inteins are recognized in various types of organisms, with some structural and / or functional features shared in some cases. The present invention can make extensive use of inteins, and variants thereof, that are recognized and additionally recognized or found. See, eg, Gogarten JP et al., 2002, Annu Rev Microbiol. 2002; 56: 263-87; Perler, F. B. (2002), InBase, the Intein Database. Nucleic Acids Res. 30, 383-384 (also via the Internet at the Web site of New England Biolabs, Inc., Ipswich, Mass .; http://www.neb.com /neb/inteins.html; Amitai G, et al., Mol Microbiol. 2003, 47 (1): 61-73; Gorbalenya AE, Nucleic Acids Res. 1998; 26 (7): 1741 -1748.Non-canonical inteins In a protein, an intein-containing unit or an intein splicing unit may be understood to include a portion of the flanking extein, wherein the structural phase may contribute to a reaction such as cleavage, ligation, etc. The term also refers to It may be understood as a category in referring to an intein-based system having a "modified intein" component.

본원에 사용된 것으로서 용어 "변형된 인테인"은, 적어도 하나의 아미노산 잔기가 인테인 스플라이싱 단위내에서 치환되거나, 이로부터 결실되거나, 이에 첨가됨으로써 절단되거나 절개된 엑스테인이 인테인에 의해 완전히 연결되지 않는 합성 인테인 또는 천연 인테인을 말할 수 있다.As used herein, the term “modified intein” refers to an intein that is cleaved or cleaved by at least one amino acid residue substituted, deleted from, or added to an intein splicing unit. Synthetic intein or natural intein that is not fully linked.

본원에 사용된 것으로서, 용어 "벡터"는 하나 이상의 이종 또는 재조합 DNA 서열을 함유하고 상이한 숙주 세포들 사이에서 전달을 위해 설계된 플라스미드, 바이러스 또는 다른 비히클과 같은 DNA 또는 RNA 분자를 말한다. 용어 "발현 벡터" 및 "유전자 치료요법 벡터"는 세포내에서 이종 DNA 단편을 혼입하고 발현시키는데 효과적인 임의의 벡터를 말한다. 클로닝 또는 발현 벡터는 추가의 성분을 포함할 수 있는데, 예를 들면, 발현 벡터는 2개의 복제 시스템을 가질 수 있으므로 이것이 2개의 유기체, 예를 들면, 발현용 사람 세포 및 클로닝 및 증폭용 원핵세포 숙주내에 유지되도록 할 수 있다. 핵산을 세포내로 도입시키는데 효과적인 어떠한 적합한 벡터를 사용할 수 있음으로써 단백질 또는 폴리펩타이드 발현이 예를 들면, 바이러스 벡터 또는 비-바이러스 플라스미드 벡터를 생성하도록 할 수 있다. 발현에 효과적인 어떠한 세포, 예를 들면, 곤충 세포 및 효모 또는 포유동물 세포와 같은 진핵 세포도 본 발명을 실시하는데 유용하다.As used herein, the term “vector” refers to a DNA or RNA molecule, such as a plasmid, virus or other vehicle, that contains one or more heterologous or recombinant DNA sequences and is designed for transfer between different host cells. The terms "expression vector" and "gene therapy vector" refer to any vector that is effective for incorporating and expressing heterologous DNA fragments in cells. The cloning or expression vector may comprise additional components, for example, the expression vector may have two replication systems so that it has two organisms, e.g., human cells for expression and prokaryotic hosts for cloning and amplification. It can be kept inside. Any suitable vector effective for introducing the nucleic acid into the cell can be used to allow protein or polypeptide expression to produce, for example, viral vectors or non-viral plasmid vectors. Any cell effective for expression, e.g., insect cells and eukaryotic cells such as yeast or mammalian cells, is also useful in practicing the present invention.

용어 "이종 DNA" 및 "이종 RNA"는, 이들이 존재하는 게놈 또는 벡터의 일부 또는 세포에 대해 내인성(천연)이 아닌 뉴클레오타이드를 말한다. 일반적으로 이종 DNA 또는 RNA는 형질유도, 감염, 형질감염, 형질전환, 전기천공(electroporation), 바이오리스틱 형질전환(biolistic transformation) 등에 의해 세포에 첨가된다. 이러한 뉴클레오타이드는 일반적으로 적어도 하나의 암호화 서열을 포함하지만, 암호화 서열은 발현될 필요가 없다. 용어 "이종 DNA"는 "이종 암호화 서열" 또는 "이식 유전자(transgene)"를 의미할 수 있다.The terms “heterologous DNA” and “heterologous RNA” refer to nucleotides that are not endogenous (natural) to the cells or portions of the genome or vector in which they are present. In general, heterologous DNA or RNA is added to cells by induction, infection, transfection, transformation, electroporation, biolistic transformation, or the like. Such nucleotides generally comprise at least one coding sequence, but the coding sequence does not need to be expressed. The term “heterologous DNA” may mean “heterologous coding sequence” or “transgene”.

본원에 사용된 것으로서, 용어 "단백질" 및 "폴리펩타이드"는 상호교환적으로 사용될 수 있으며 전형적으로 본 발명의 자가 프로세싱 절단 부위-함유 벡터를 사용하여 발현되는 목적한 "단백질" 및 "폴리펩타이드"를 말한다. 이러한 "단백질" 및 "폴리펩타이드"는 하기에 추가로 기술된 바와 같이 조사, 진단 또는 치료학적 목적을 위해 유용한 어떠한 단백질 또는 폴리펩타이드일 수 있다. 본원에 사용된 것으로서, 폴리프로테인은 2개 이상의 폴리펩타이드 생성물을 생산하기 위해 프로세싱하도록 예정된 단백질이다.As used herein, the terms "protein" and "polypeptide" can be used interchangeably and are typically the desired "protein" and "polypeptide" expressed using the self processing cleavage site-containing vector of the present invention. Say. Such “proteins” and “polypeptides” can be any protein or polypeptide useful for investigational, diagnostic, or therapeutic purposes, as further described below. As used herein, polyprotein is a protein intended to be processed to produce two or more polypeptide products.

본원에 사용된 것으로서, 용어 "다합체"는 기능 단백질을 형성하도록 조립될 수 있는 2개 이상의 폴리펩타이드 쇄(때때로 "소단위"로 언급됨)로 구성된 단백질을 말한다. 다합체는 2개(이합체), 3개(삼합체), 4개(사합체) 또는 이상(예를 들어, 오합체 등) 펩타이드 쇄로 구성될 수 있다. 다합체는 자가-조립(self-assembly)으로 생성될 수 있거나, 조립을 보조하기 위한 촉매와 같은 성분을 필요로 할 수 있다. 다합체는 동일한 펩타이드 쇄(단독-다합체) 또는 2개 이상의 상이한 펩타이드 쇄(헤테로-다합체) 만으로 구성될 수 있다. 이러한 다합체는 구조적으로 또는 화학적으로 기능성일 수 있다. 효소, 호르몬, 항체, 사이토킨, 케모킨 및 수용체를 포함하나, 이에 한정되지 않는 많은 다합체가 당해 분야에 공지되어 있고 사용된다. 따라서, 다합체는 생물학적(예를 들어, 약제) 및 산업적(예를 들어, 생물가공/생물생산) 용도 둘 다를 가질 수 있다.As used herein, the term "multimer" refers to a protein composed of two or more polypeptide chains (sometimes referred to as "subunits") that can be assembled to form a functional protein. Multimers may be composed of two (dimeric), three (trimeric), four (quameric) or aberrant (eg, meric, etc.) peptide chains. Multimers may be produced self-assembly or may require components such as catalysts to assist in assembly. The multimer may consist of the same peptide chain (alone-multimer) or only two or more different peptide chains (hetero-multimer). Such multimers may be structurally or chemically functional. Many multimers are known and used in the art, including but not limited to enzymes, hormones, antibodies, cytokines, chemokines and receptors. Thus, multimers can have both biological (eg, pharmaceutical) and industrial (eg, bioprocessing / bioproduction) uses.

본원에 사용된 것으로서, 용어 "태그(tag)"는 벡터 삽입체의 하나 이상의 발현 생성물의 검출 및/또는 정제를 허용하도록 기능할 수 있는 발현 벡터로 혼입될 수 있는 펩타이드를 말한다. 이러한 태그는 당해 분야에 잘 공지되어 있으며 표시된 아비딘에 의해 검출될 수 있는 비오티닐 잔기(예를 들어, 광학적 또는 비색계 방법(colorimetric method)에 의해 검출될 수 있는 형광성 마커 또는 효소 활성을 함유하는 스트렙타비딘)의 폴리펩타이드에 대한 부착 또는 방사선표지된 아미노산을 포함할 수 있다. FLAG, 글루타티온-S-트랜스퍼라제, 말토즈 결합 단백질, 셀룰로즈-결합 도메인, 티오레독신, NusA, 미스틴, 키틴-결합 도메인, 큐티나제, AGT, GFP 및 기타와 같은 친화성 태그가 단백질 발현 및 정제 시스템에서와 같이 광범위하게 사용된다. 폴리펩타이드에 대한 태그의 추가의 비제한적 예는 다음을 포함하나, 이에 한정되지 않는다: 히스티딘 태그, 방사선동위원소 또는 방사성 핵종(예를 들어, 3H, 14C, 35S, 90Y, 99Tc, 111 In, 125I, 131I, 177Lu, 166Ho, 또는 153Sm); 형광성 태그(예를 들어, FITC, 로다민, 란타나이드 포스포르), 효소 태그(예를 들어, 서양 고추냉이 퍼옥시다제, 루시페라제, 알칼린 포스파타제); 화학발광성 태그; 비오티닐 그룹; 제2의 리포터[예를 들어, 류신 지퍼 쌍 서열(leucine zipper pair sequence), 제2 항체에 대한 결합 부위, 금속 결합 도메인, 에피토프 태그]에 의해 인식되는 소정의 폴리펩타이드 에피토프; 및 가돌리늄 킬레이트.As used herein, the term “tag” refers to a peptide that can be incorporated into an expression vector that can function to allow detection and / or purification of one or more expression products of a vector insert. Such tags are well known in the art and contain a biotinyl moiety that can be detected by the indicated avidin (eg, a strep containing fluorescent marker or enzymatic activity that can be detected by optical or colorimetric methods). Tavidin) to the polypeptide or may comprise a radiolabeled amino acid. Affinity tags such as FLAG, glutathione-S-transferase, maltose binding protein, cellulose-binding domain, thioredoxin, NusA, mystin, chitin-binding domain, cutinase, AGT, GFP, and others are used for protein expression and Widely used as in purification systems. Additional non-limiting examples of tags for polypeptides include, but are not limited to, histidine tags, radioisotopes or radionuclides (eg, 3 H, 14 C, 35 S, 90 Y, 99 Tc). , 111 In, 125 I, 131 I, 177 Lu, 166 Ho, or 153 Sm); Fluorescent tags (eg FITC, rhodamine, lanthanide phosphor), enzyme tags (eg horseradish peroxidase, luciferase, alkaline phosphatase); Chemiluminescent tags; Biotinyl group; Certain polypeptide epitopes recognized by a second reporter (eg, leucine zipper pair sequence, binding site for a second antibody, metal binding domain, epitope tag); And gadolinium chelates.

본 발명의 바이러스 유전자 치료요법 벡터와 관련하여 본원에 사용된 것으로서 용어 "복제 결핍성"은, 바이러스 벡터가 독립적으로 추가로 복제하여 이의 게놈을 패키징할 수 없음을 의미한다. 예를 들면, 대상체의 세포가 rAAV 비리온(virion)으로 감염된 경우, 이종 유전자가 감염된 세포내에서 발현되나, 감염된 세포가 AAV rep 및 cap 유전자와 보조 기능 유전자(accessory function gene)를 결여하고 있다는 사실로 인하여, rAAV는 복제할 수 없다.As used herein in connection with a viral gene therapy vector of the present invention, the term "replicating deficiency" means that the viral vector cannot independently replicate and package its genome independently. For example, if a cell of a subject is infected with rAAV virion, the heterologous gene is expressed in the infected cell, but the infected cell lacks the AAV rep and cap genes and the accessory function gene. Because of this, rAAV cannot replicate.

본원에 사용된 것으로서, "레트로바이러스 전이 벡터"는 이식유전자를 암호화하고 벡터의 패키징에 필수적인 뉴클레오타이드 서열을 추가로 포함하는 뉴클레오타이드 서열을 포함하는 발현 벡터를 말한다. 바람직하게는, 레트로바이러스 전달 벡터는 또한 세포내에서 이식유전자 발현을 위해 필수적인 서열을 포함한다.As used herein, "retroviral transfer vector" refers to an expression vector comprising a nucleotide sequence that encodes a transgene and further comprises a nucleotide sequence essential for packaging of the vector. Preferably, retroviral delivery vectors also include sequences essential for transgene expression in cells.

본원에 사용된 것으로서, "패키징 시스템"은 재조합 바이러스를 패키징하는데 포함된 바이러스 단백질을 암호화하는 유전자를 포함하는 바이러스 작제물 세트를 의미한다. 전형적으로, 패키징 시스템의 작제물은 궁극적으로 패키징 세포내로 혼입된다.As used herein, "packaging system" refers to a set of viral constructs comprising genes encoding viral proteins included in packaging a recombinant virus. Typically, the constructs of the packaging system ultimately get incorporated into the packaging cells.

본원에 사용된 것으로서, "제2 세대" 렌티바이러스 벡터 시스템은, 이로부터 보조 유전자, vif, vpr, vpu 및 nef가 결실되거나 불활성화되는 것과 같은 기능성 보조 유전자를 결여한 렌티바이러스 패키징 시스템을 말한다(참조: 예를 들면, Zufferey et al. 1997. Nat. Biotechnol. 15:871-875).As used herein, a "second generation" lentiviral vector system refers to a lentiviral packaging system that lacks functional accessory genes such as from which accessory genes, vif, vpr, vpu, and nef are deleted or inactivated ( See, eg, Zufferey et al. 1997. Nat. Biotechnol. 15: 871-875.

본원에 사용된 것으로서, "제3 세대" 렌티바이러스 벡터 시스템은 제2 세대 벡터 시스템의 특성을 가지며, 이로부터 tat 유전자가 결실되거나 불활성화된 것과 같은 기능성 tat 유전자를 추가로 결여한 렌티바이러스 패키징 시스템을 말한다. 전형적으로, rev를 암호화하는 유전자는 별개의 발현 작제물 상에 제공된다(참조: 예를 들면, Dull et al. 1998. J. Virol. 72:8463-8471).As used herein, a "third generation" lentiviral vector system has the characteristics of a second generation vector system from which a lentiviral packaging system further lacking a functional tat gene such as a tat gene deleted or inactivated. Say Typically, the gene encoding rev is provided on a separate expression construct (see, eg, Dull et al. 1998. J. Virol. 72: 8463-8471).

바이러스 또는 바이러스 벡터와 관련하여 본원에 사용된 것으로서, "슈도타입화된(pseudotyped)"은 천연의 바이러스 엔벨로프 단백질을 이종 또는 기능적으로 변형된 바이러스 엔벨로프 단백질로 교체시키는 것을 말한다.As used herein in the context of a virus or viral vector, “pseudotyped” refers to the replacement of a native viral envelope protein with a heterologous or functionally modified viral envelope protein.

재조합체 DNA 작제물 또는 벡터와 관련하여 본원에 사용된 것으로서 용어 "작동적으로 연결된"은 재조합체 DNA 작제물 또는 벡터의 뉴클레오타이드 성분들이 일반적으로 서로에 대해 공유결합으로 연결되어 있음을 의미한다. 일반적으로, "작동적으로 연결된" DNA 서열은 연속적이며, 분비성 리더의 경우에, 연속적이고 동일한 판독 프레임내에 있다. 그러나, 인핸서(enhancer)는, 이의 발현이 상향조절된 서열과 연속적일 필요가 없다. 당해 용어는 '작동적으로 위치된'과 일치한다.As used herein in reference to a recombinant DNA construct or vector, the term “operably linked” means that the nucleotide components of the recombinant DNA construct or vector are generally covalently linked to each other. In general, "operably linked" DNA sequences are contiguous and, in the case of a secretory leader, are contiguous and in the same reading frame. However, enhancers do not have to be contiguous with sequences whose expression is upregulated. The term is consistent with 'operably positioned'.

인핸서 서열은 프로모터-의존성 유전자 발현에 영향을 미치며 천연 유전자의 5' 또는 3' 영역내에 위치할 수 있다. "인핸서"는 근접한 유전자의 전사를 자극하거나 억제하는 시스-작용 성분이다. 전사를 억제하는 인핸서는 또한 "사일런서(silencer)"로 명명된다. 인핸서는 암호화 서열로부터 및 전사된 영역의 하부 위치로부터 몇개의 킬로염기(kilobase) 쌍(kb)까지의 거리에 걸쳐 한 배향으로 기능할 수 있다(즉, 암호화 서열과 관련될 수 있다). 또한, 매트릭스 부착 영역과 같은 인슐레이터(insulator) 또는 크로마틴 개방 서열[참조: Chung, Cell, 1993, Aug 13;74(3):505-14, Frisch et al, Genome Research, 2001, 12:349-354, Kim et al, J. Biotech 107, 2004, 95-105]을 사용하여 안정하게 통합된 유전자 카세트의 전사를 향상시킬 수 있다.Enhancer sequences affect promoter-dependent gene expression and can be located within the 5 'or 3' region of a native gene. An "enhancer" is a cis-acting component that stimulates or inhibits transcription of adjacent genes. Enhancers that inhibit transcription are also termed "silencers". Enhancers may function in one orientation over the distance from the coding sequence and from the lower position of the transcribed region to several kilobase pairs (kb) (ie, associated with the coding sequence). In addition, an insulator or chromatin open sequence, such as a matrix attachment region (Chung, Cell, 1993, Aug 13; 74 (3): 505-14, Frisch et al, Genome Research, 2001, 12: 349- 354, Kim et al, J. Biotech 107, 2004, 95-105, can be used to enhance the transcription of stably integrated gene cassettes.

본원에 사용된 것으로서, 용어 "유전자" 또는 '암호화 유전자"는, 적절한 조절 서열에 작동적으로 연결되는 경우 시험관내에서 또는 생체내에서 폴리펩타이드내로 전사(DNA)되고 해독(mRNA)되는 핵산 서열을 의미한다. 상기 유전자는 암호화 영역을 선행하는 및 후속하는 영역, 예를 들면, 5' 해독되지 않은(5' UTR) 또는 "리더" 서열 및 3' UTR 또는 "트레일러(trailer)" 서열, 및 개개의 암호화 분절(엑손)들 사이의 개재 서열(인트론)을 포함하거나 포함하지 않을 수 있다.As used herein, the term “gene” or “coding gene” refers to a nucleic acid sequence that is transcribed (DNA) and translated (mRNA) into a polypeptide in vitro or in vivo when operably linked to an appropriate regulatory sequence. The gene is a region preceding and following a coding region, such as a 5 'untranslated (5' UTR) or "leader" sequence and a 3 'UTR or "trailer" sequence, and individual It may or may not include an intervening sequence (intron) between the coding segments (exons) of.

"프로모터"는 RNA 폴리머라제의 결합을 지시함으로써 RNA 합성을 촉진하는 DNA 서열, 즉, 전사를 지시하는데 충분한 최소 서열이다. 프로모터 및 상응하는 단백질 또는 폴리펩타이드 발현은 세포-유형 특이적, 조직-특이적 또는 종 특이적일 수 있다. 또한, 본 발명의 핵산 작제물 또는 벡터에 포함된 것은 프로모터 서열과 연속적이거나 연속적이지 않을 수 있는 인핸서 서열이다.A "promoter" is a DNA sequence that promotes RNA synthesis by directing the binding of RNA polymerase, ie, a minimal sequence sufficient to direct transcription. Promoter and corresponding protein or polypeptide expression may be cell-type specific, tissue-specific or species specific. Also included in the nucleic acid constructs or vectors of the invention are enhancer sequences that may or may not be contiguous with the promoter sequence.

본원에 광범위하게 사용된 것으로서, "전사 조절 서열" 또는 발현 제어 서열은 흔히 영양 또는 환경 시그날에 대한 반응시, 관련된 암호화 서열의 전사를 조정하거나 조절하는 프로모터 서열 및 물리적으로 관련된 서열을 포함한다. 서열과 관련된 것들은 조직 또는 세포 특이적인 발현, 환경 시그날에 대한 반응, 전사를 증가시키거나 감소시키는 단백질의 결합 등을 측정할 수 있다. "조절가능한 프로모터"는, 이의 활성이 시스 또는 트랜스 작용하는 인자(예를 들어, 외부 시그날 또는 제제에 의해 활성화되는 유도성 프로모터)에 의해 영향받는 어떠한 프로모터이다.As used broadly herein, “transcriptional regulatory sequences” or expression control sequences often include physically related sequences and promoter sequences that modulate or regulate the transcription of related coding sequences in response to nutritional or environmental signals. Those related to the sequence can measure tissue or cell specific expression, response to environmental signals, binding of proteins to increase or decrease transcription, and the like. A “regulatory promoter” is any promoter whose activity is influenced by a factor that acts cis or trans (eg, an inducible promoter activated by an external signal or agent).

"구성적 프로모터"는 대부분의 경우 많은 또는 모든 조직/세포 유형에서 RNA 생산을 지시하는 임의의 프로모터, 예를 들면, 포유동물 세포내에서 클로닝된 DNA 삽입체의 구성적 발현을 촉진하는 사람 CMV 이미디에이트 얼리 인핸서(immediate early enhancer)/프로모터 영역이다.A “constitutive promoter” is in most cases a human CMV image that promotes the constitutive expression of cloned DNA inserts in any promoter, eg, mammalian cells, that directs RNA production in many or all tissue / cell types. Diet early enhancer / promoter region.

용어 "전사 조절 단백질", "전사 조절 인자" 및 "전사 인자"는 본원에서 상호교환적으로 사용되며, DNA 반응 성분에 결합함으로써 관련된 유전자 또는 유전자들의 발현을 전사적으로 조절하는 핵 단백질을 말한다. 전사 조절 단백질은 일반적으로 DNA 반응 성분에 직접 결합하나, 일부 경우에 DNA에 대한 결합은 최종적으로 DNA 반응 성분에 결합하거나, 결합된 다른 단백질에 대한 결합의 수단으로 간접적으로 될 수 있다.The terms "transcriptional regulatory protein", "transcriptional regulatory factor" and "transcriptional factor" are used interchangeably herein and refer to nuclear proteins that transcriptionally regulate the expression of a related gene or genes by binding to a DNA response component. Transcriptional regulatory proteins generally bind directly to the DNA response component, but in some cases binding to the DNA can ultimately bind to the DNA response component or indirectly as a means of binding to other proteins to which it is bound.

본원에 사용된 것으로서, "면역글로불린" 및 "항체"는 완전한 분자 및 이의 단편, 예를 들면, 목적한 항원 결정인자에 결합할 수 있는 Fa, F(ab')2, 및 Fv를 말한다. 이러한 "면역글로불린" 및 "항체"는, 분자량이 대략 23,000 달톤인 2개의 동일한 경쇄 폴리펩타이드 쇄, 및 분자량이 53,000 내지 70,000인 2개의 동일한 중쇄로 구성된다. 4개의 쇄는 "Y" 구조내에서 이황화물 결합에 의해 연결된다. 중쇄는 감마(IgG), 뮤(IgM), 알파(IgA), 델타(IgD) 또는 엡실론(IgE)으로 분류되며 제공된 항체의 효과기 기능을 결정하는 면역글로불린의 부류 지정을 위한 기준이다. 경쇄는 카파 또는 람다로서 분류된다. 본원에서 "면역글로불린 또는 이의 단편"에 대한 참조가 이루어진 경우, 이러한 "이의 단편"은 면역학적으로 기능성인 면역글로불린 단편, 특히 완전한 면역글로불린의 적어도 10%의 결합 친화성을 갖는 이의 인지체 리간드에 결합하는 것임이 이해될 것이다.As used herein, "immunoglobulin" and "antibody" refer to Fa, F (ab ') 2 , and Fv capable of binding a complete molecule and fragments thereof, eg, the desired antigenic determinant. These “immunoglobulins” and “antibodies” consist of two identical light chain polypeptide chains having a molecular weight of approximately 23,000 Daltons, and two identical heavy chains having a molecular weight of 53,000 to 70,000. The four chains are linked by disulfide bonds in the "Y" structure. Heavy chains are classified as gamma (IgG), mu (IgM), alpha (IgA), delta (IgD) or epsilon (IgE) and are the criteria for classifying immunoglobulins that determine the effector function of a given antibody. Light chains are classified as kappa or lambda. Where reference is made herein to "immunoglobulins or fragments thereof", such "fragments thereof" refer to immunologically functional immunoglobulin fragments, particularly their cognitive ligands having a binding affinity of at least 10% of complete immunoglobulins. It will be understood that the combination.

항체의 Fab 단편은 항체 분자의 1가 항원-결합 단편이다. Fv 단편은 2개 쇄로서 발현된 중쇄의 가변 영역 및 경쇄의 가변 영역을 함유하는 유전적으로 가공된 단편이다.Fab fragments of antibodies are monovalent antigen-binding fragments of antibody molecules. Fv fragments are genetically engineered fragments containing the variable region of the heavy chain and the variable region of the light chain expressed as two chains.

용어 "사람화된 항체"는, 하나 이상의 아미노산이 비-항원 결합 영역내에서 교체됨으로써 사람 항체와 보다 더 비슷한 한편, 항체의 원래의 결합 활성을 여전히 보유한 항체 분자를 말한다(참조: 미국 특허 제6,602,503호).The term “humanized antibody” refers to an antibody molecule in which one or more amino acids are replaced in a non-antigen binding region that is more similar to a human antibody while still retaining the original binding activity of the antibody (see US Pat. No. 6,602,503). number).

본원에 사용된 것으로서, 용어 "항원성 결정인자"는 특수 항체와 접촉하는 분자의 단편(즉, 에피토프)을 말한다. 단백질의 다수의 영역 또는, 단백질 또는 당단백질의 펩타이드 또는 당펩타이드는 단백질에서 제공된 영역 또는 3차원 구조에 특이적으로 결합하는 항체의 생산을 유도할 수 있다. 이들 영역 또는 구조는 항원성 결정인자 또는 에피토프로 언급된다. 항원성 결정인자는 항체에 대한 결합을 위해 완전한 항원(즉, 면역 반응을 유발시키는데 사용된 면역원)과 경쟁할 수 있다.As used herein, the term “antigenic determinant” refers to a fragment of a molecule (ie epitope) in contact with a particular antibody. Multiple regions of a protein or peptides or glycopeptides of a protein or glycoprotein can induce the production of an antibody that specifically binds to a region or three-dimensional structure provided in the protein. These regions or structures are referred to as antigenic determinants or epitopes. Antigenic determinants can compete with a complete antigen (ie, an immunogen used to elicit an immune response) for binding to the antibody.

용어 "단편"은, 본 발명의 재조합체 단백질 또는 폴리펩타이드를 언급하는 경우, 상응하는 완전한 길이의 단백질 또는 폴리펩타이드의 기능 또는 활성 중 적어도 하나를 보유하는 상응하는 완전한 길이의 단백질 또는 폴리펩타이드의 아미노산 서열 중 전부가 아닌, 일부와 동일한 아미노산 서열을 갖는 펩타이드 또는 폴리펩타이드를 의미한다. 단편은 바람직하게는 완전한 길이의 단백질 또는 폴리펩타이드의 적어도 20 내지 100개의 연속적인 아미노산 잔기를 포함한다.The term “fragment”, when referring to a recombinant protein or polypeptide of the invention, refers to an amino acid of a corresponding full length protein or polypeptide that retains at least one of the function or activity of the corresponding full length protein or polypeptide. A peptide or polypeptide having the same amino acid sequence as some but not all of the sequences. The fragment preferably comprises at least 20 to 100 contiguous amino acid residues of a full length protein or polypeptide.

본원에 사용된 것으로서, 용어 "투여하는" 또는 "도입하는"은 당해 분야에 공지된 어떠한 경로에 의해서도 이를 필요로 하는 사람 또는 동물에게 단백질(면역글로불린 포함)을 전달함을 의미한다. 약제학적 담체 및 제형 또는 조성물은 또한 당해 분야에 공지되어 있다. 투여 경로는 정맥내, 근육내, 피내, 피하, 경피, 점막, 종양내 또는 점막을 포함할 수 있다. 또한, 당해 용어들은 배양물내 세포 또는 세포들 및 대상체의 세포 또는 기관에 재조합체 단백질 발현용 벡터를 전달함을 의미할 수 있다. 이러한 투여 또는 도입은 생체내, 시험관내 또는 생체외에서 일어날 수 있다. 재조합체 단백질 또는 폴리펩타이드 발현용 벡터는, 통상적으로 물리적 수단(예를 들면, 인산칼슘 형질감염, 전기영동, 미세주입 또는 지질감염)에 의한 이종 DNA의 세포내로의 삽입; 통상적으로 감염성 제제, 즉, 바이러스를 사용한 도입을 말하는 감염; 또는 전형적으로 바이러스제(예를 들어, 박테리오파지)를 사용한 하나의 미생물로부터 다른 미생물로 유전 물질의 전달 또는 바이러스를 사용한 세포의 안정한 형질감염을 의미하는 형질도입을 의미하는, 형질감염에 의해 세포내로 도입될 수 있다.As used herein, the term “administering” or “introducing” means delivering a protein (including immunoglobulin) to a person or animal in need thereof by any route known in the art. Pharmaceutical carriers and formulations or compositions are also known in the art. Routes of administration may include intravenous, intramuscular, intradermal, subcutaneous, transdermal, mucosal, intratumoral or mucosal. In addition, the terms may refer to delivering a vector for recombinant protein expression to a cell or cells in culture and to a cell or organ of a subject. Such administration or introduction may occur in vivo, in vitro or ex vivo. Vectors for expressing recombinant proteins or polypeptides typically include insertion of heterologous DNA into cells by physical means (eg, calcium phosphate transfection, electrophoresis, microinjection or lipid infection); Infections generally referring to introduction with an infectious agent, ie a virus; Or transfection, which typically refers to the transfer of genetic material from one microorganism with a viral agent (eg bacteriophage) to another or transduction, which means stable transfection of cells with a virus. Can be.

"형질전환"은 통상적으로 종양유전자를 발현하고 이에 따라 연속 성장 방식, 예를 들면, 종양 세포로 전환되어진 이종 DNA 또는 세포를 포함하는 세균을 의미하기 위해 사용된다. 세포를 "형질전환"시키기 위해 사용된 벡터는 플라스미드, 바이러스 또는 다른 비히클일 수 있다."Transformation" is commonly used to mean bacteria comprising heterologous DNA or cells that express an oncogene and thus have been converted into a continuous growth mode, eg, tumor cells. The vector used to “transform” the cell can be a plasmid, virus or other vehicle.

전형적으로, 세포는 이종 DNA(즉, 벡터)의 세포내로의 투여, 도입 또는 삽입에 사용된 수단에 의존적인 "형질도입된", "감염된", "형질감염된" 또는 "형질전환된" 것을 의미한다. 용어 "형질도입된", "형질감염된" 및 "형질전환된"은 이종 DNA의 도입 방법과 상관없이 본원에서 상호교환적으로 사용될 수 있다.Typically, a cell is meant to be "transduced", "infected", "transfected" or "transformed" depending on the means used for administration, introduction or insertion of heterologous DNA (ie, vector) into the cell. do. The terms “transduced”, “transfected” and “transformed” can be used interchangeably herein regardless of the method of introducing heterologous DNA.

본원에 사용된 것으로서, 용어 "안정하게 형질전환된", "안정하게 형질감염된' 및 "유전자이식"은 게놈내로 통합된 비-천연(이종) 핵산 서열을 갖는 세포를 말한다. 안정한 형질감염은 이들의 게놈내로 통합의 수단에 의해 또는 에피솜 성분으로서 안정하게 복제하는 형질감염된 DNA를 함유하는 딸 세포(daughter cell)의 집단으로 구성된 세포주 또는 클론의 확립으로 입증된다. 일부 경우에, "형질감염"은 안정하지 않은데, 즉, 일시적이다. 일시적인 형질감염의 경우, 외인성 또는 이종 DNA가 발현되나, 도입된 서열은 게놈내로 통합되지 않거나 숙주 세포는 복제할 수 없다.As used herein, the terms “stable transformed”, “stable transfected” and “genetransplantation” refer to cells having non-natural (heterologous) nucleic acid sequences integrated into the genome. Evidence of the establishment of a cell line or clone consisting of a population of daughter cells containing transfected DNA that reliably replicates by means of integration into the genome or as an episomal component. Is not stable, ie, transient In transient transfection, exogenous or heterologous DNA is expressed, but the introduced sequence is not integrated into the genome or the host cell cannot replicate.

본원에 사용된 것으로서, "생체외 투여"는, 주요 세포가 대상체로부터 수집되고, 벡터가 세포로 투여되어 형질도입되거나, 감염되거나 형질감염된 재조합체 세포가 생산되고 재조합체 세포가 동일하거나 상이한 대상체에게 재투여되는 공정을 말한다.As used herein, "ex vivo administration" refers to a subject in which a major cell is collected from a subject and the vector is administered to the cell to produce a transduced, infected or transfected recombinant cell and the same or different recombinant cells. Refers to the process to be re-administered.

"멀티시스트론성 전사체(multicistronic transcript)"는 1개 이상의 단백질 암호화 영역, 또는 시스트론을 함유하는 mRNA 분자를 말한다. 2개의 암호화 영역을 포함하는 mRNA는 "비시스트론성 전사체"로 나타낸다. "5'-인접한" 암호화 영역 또는 시스트론은, 이의 전사 개시 코돈(일반적으로 AUG)가 멀티시스트론성 mRNA 분자의 5' 말단에 대해 최대로 근접한 암호화 영역이다. "5'-원위(distal)" 암호화 영역 또는 시스트론은, 이의 해독 개시 코돈(일반적으로 AUG)이 mRNA의 5' 말단에 대해 가장 가까운 개시 코돈이 아닌 것이다."Multicistronic transcript" refers to an mRNA molecule containing one or more protein coding regions, or cistrons. MRNAs comprising two coding regions are referred to as "non-cistronic transcripts." A "5'-adjacent" coding region or cistron is a coding region whose transcription initiation codon (typically AUG) is closest to the 5 'end of the multicistronic mRNA molecule. A "5'-distal" coding region or cistron is one whose translational start codon (usually AUG) is not the closest start codon for the 5 'end of the mRNA.

용어 "5'-원위" 및 "하부"는 mRNA 분자의 5' 말단에 근접하지 않은 암호화 영역을 말하기 위해 동의어로 사용된다.The terms "5'-distant" and "lower" are used synonymously to refer to a coding region that is not close to the 5 'end of an mRNA molecule.

본원에 사용된 것으로서, "공-전사된"은, 2개의(또는 이상의) 전사 해독 프레임 또는 암호화 영역 또는 폴리뉴클레오타이드가 프로모터를 포함하는 단일 전사 제어 또는 조절 성분의 전사 제어하에 있음을 의미한다.As used herein, “co-transcribed” means that two (or more) transcriptional translation frames or coding regions or polynucleotides are under transcriptional control of a single transcriptional control or regulatory component comprising a promoter.

본원에 사용된 것으로서 용어 "숙주 세포"는 벡터를 사용하여 형질도입되거나, 감염되거나, 형질감염되거나 형질전환된 세포를 말한다. 벡터는 플라스미드, 바이러스 입자, 파아지 등일 수 있다. 온도, pH 등과 같은 배양 조건은 발현을 위해 선택된 숙주 세포와 함께 이미 사용된 것들이며 당해 분야의 숙련가에게 명백할 것이다. 용어 "숙주 세포"는 원래의 형질도입되거나, 감염되거나, 형질감염되거나 형질전환된 세포 및 이의 후대세포를 의미하는 것이 인지될 것이다.As used herein, the term “host cell” refers to a cell that has been transduced, infected, transfected or transformed using a vector. Vectors can be plasmids, viral particles, phages and the like. Culture conditions such as temperature, pH and the like are those already used with the host cell selected for expression and will be apparent to those skilled in the art. It will be appreciated that the term "host cell" refers to cells that have been originally transduced, infected, transfected or transformed and their progenitor cells.

본원에 사용된 것으로서, 용어 "생물학적 활성" 및 "생물학적으로 활성인"은 ELISA 플레이트내 리간드-수용체 분석과 같이, 배양물내에서 세포주 또는 세포-유리된 시스템에서 특수 단백질에 기여한 활성을 말한다. "면역글로불린", "항체" 또는 이의 단편의 "생물학적 활성"은 항원 결정인자에 결합함으로써 면역학적 기능을 촉진하는 능력을 말한다. 호르몬 또는 인터루킨의 "생물학적 활성'은 당해 분야에 공지되어 있다.As used herein, the terms “biologically active” and “biologically active” refer to the activity that contributes to a particular protein in a cell line or cell-free system in culture, such as a ligand-receptor assay in an ELISA plate. "Biological activity" of an "immunoglobulin", "antibody" or fragment thereof refers to the ability to promote immunological function by binding to antigenic determinants. The "biological activity" of hormones or interleukins is known in the art.

본원에 사용된 것으로서, 용어 "종양" 및 "암"은 정상적인 성장 및/또는 발달에 걸쳐 제어의 적어도 부분적인 손실을 나타내는 세포를 말한다. 예를 들면, 흔히 종양 또는 암 세포는 일반적으로 손실 접촉 억제를 가지며 침입성일 수 있고/있거나 전이하는 능력을 가진다.As used herein, the terms “tumor” and “cancer” refer to cells that exhibit at least partial loss of control over normal growth and / or development. For example, often tumor or cancer cells generally have lossy contact inhibition and may be invasive and / or have the ability to metastasize.

항체는 중쇄 및 경쇄의 이종이합체인 면역글로불린 단백질이다. 일반적인 항체는 함께 연합되는 2개의 중쇄 및 2개의 경쇄(또는 이의 기능성 단편)를 지닌 다합체이다. 항체는 흔히 동형에 의존성인 이합체성, 삼합체성, 사합체성, 오합체성 등인 구조의 추가의 중합체 차수를 가질 수 있다. 이들은 포유동물 배양 발현 시스템에서 단일 벡터 또는 2개의 벡터로부터 완전한 길이의 형태로 발현시키기에 극도로 어려운 것으로 입증되어 있다. 다음의 몇가지 방법이 항체의 생산을 위해 현재 사용되고 있다: "폴리클로날" 항체를 생산하기 위한 동물의 생체내 면역화, 단클론 항체를 생산하기 위한 B-세포 하이브리도마의 시험관내 세포 배양(참조: 본원에 참조로 인용된, Kohler, et al. 1988. Eur. J. Immunol. 6:511 ; Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, 1988); 및 재조합 DNA 기술(본원에 참조로 인용된, 예를 들면, 카빌리(Cabilly) 등의 미국 특허 제6331415호에 기술됨).Antibodies are immunoglobulin proteins that are heterodimers of heavy and light chains. Typical antibodies are multimers with two heavy chains and two light chains (or functional fragments thereof) associated together. Antibodies can often have additional polymer orders of structure that are dimeric, trimerous, tetrameric, meric, etc. that are dependent on isomorphism. They have proven extremely difficult to express in full length form from a single vector or two vectors in a mammalian culture expression system. Several methods are currently used for the production of antibodies: in vivo immunization of animals to produce “polyclonal” antibodies, in vitro cell culture of B-cell hybridomas to produce monoclonal antibodies (see: Kohler, et al. 1988. Eur. J. Immunol. 6: 511; Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, 1988); And recombinant DNA techniques (see, eg, US Pat. No. 6,314,151 to Cabilly et al., Incorporated herein by reference).

면역글로불린 폴리펩타이드의 기본 분자 구조는, 분자량이 대략 23,000 달톤인 2개의 동일한 경쇄, 및 분자량이 53,000 내지 70,000인 2개의 동일한 중쇄를 포함하는 것으로 잘 공지되어 있으며, 여기서 4개의 쇄는 "Y" 구조로 이황화 결합에 의해 연결되어 있다. 아미노산 서열은 Y의 상부의 N-말단 끝으로부터 각각의 쇄의 하부의 C-말단 끝에 이른다. N-말단 끝에 항원 결합의 특이성을 제공하는 가변 영역(길이가 약 100개 아미노산)이 존재한다.The basic molecular structure of an immunoglobulin polypeptide is well known to include two identical light chains having a molecular weight of approximately 23,000 Daltons, and two identical heavy chains having a molecular weight of 53,000 to 70,000, wherein the four chains are of the “Y” structure. Connected by disulfide bonds. The amino acid sequence extends from the N-terminal end of the top of Y to the C-terminal end of the bottom of each chain. There is a variable region (about 100 amino acids in length) that provides specificity of antigen binding at the N-terminal end.

본 발명은 천연 서열(즉, 항원에 의한 자극에 대한 반응시 생산된 서열)을 갖는 완전한 길이의 항체 및 항체 단편, 단일의 안정하게 폴딩된 폴리펩타이드 쇄내 중쇄 및 경쇄 둘다의 항원 결합 가변 영역을 결합한 일본쇄 항체; 1가 항체(이는 제2 중쇄의 Fc 영역에 결합하는 중쇄/경쇄 이합체를 포함한다); 면역글로불린 분자의 완전한 "Y" 영역, 즉, 경쇄 또는 중쇄 단독의 "Y"의 측쇄, 또는 이의 일부(즉, 일반적으로 Fab'로 공지된 하나의 중쇄 및 하나의 경쇄의 응집체)를 포함하는 "Fab 단편"; 2개 이상의 상이한 항원에 대해 특이성을 갖는 "하이브리드 면역글로불린"(예를 들어, 미국 특허 제6,623,940호에 기술된 바와 같은 쿼드로마(quadroma) 또는 이특이적 항체); 중쇄 및 경쇄가 상이한 종 또는 특이성으로부터의 것을 모사하는 "복합체 면역글로불린"; 및 중쇄 및 경쇄의 아미노산 서열 각각 중 일부가 하나 이상의 종으로부터 기원하는(즉, 가변 영역은 뮤린(murine) 항체와 같은 하나의 공급원으로부터 기원한 반면, 고정 영역은 사람 항체와 같이 다른 것으로부터 기원하는) "키메라 항체"를 포함하나, 이에 한정되지 않는, 모든 유형의 면역글로불린의 생산을 위한 개선된 방법에 관한 것이다.The present invention incorporates antigen-binding variable regions of both full length antibodies and antibody fragments with native sequences (ie, sequences produced in response to stimulation by antigen), both heavy and light chains within a single, stably folded polypeptide chain. Single-chain antibodies; Monovalent antibodies (which include heavy / light chain dimers that bind to the Fc region of a second heavy chain); "Which contains the complete" Y "region of the immunoglobulin molecule, ie the side chain of" Y "of the light chain or heavy chain alone, or a portion thereof (ie, one heavy chain and one light chain generally known as Fab '). Fab fragments; “Hybrid immunoglobulins” (eg, quadroma or bispecific antibodies as described in US Pat. No. 6,623,940) having specificity for at least two different antigens; “Complex immunoglobulins” that mimic heavy and light chains from different species or specificities; And some of the amino acid sequences of the heavy and light chains each are from one or more species (ie, the variable region is from one source, such as a murine antibody, while the fixed region is from another, such as a human antibody). ) And improved methods for the production of all types of immunoglobulins, including but not limited to "chimeric antibodies".

본 발명의 조성물 및 방법은 면역글로불린 또는 이의 단편의 생산시 유용성이 밝혀졌으며, 여기서 중쇄 또는 경쇄는 "포유동물", "키메라"이거나 이의 효능을 향상시키는 방식으로 변형된다. 변형된 항체는 변형되지 않은 형태의 동일한 생물학적 활성을 보유하는 아미노산 및 핵산 서열 변이체 둘 다 및 활성이 변경되도록 변형된, 즉 상보체 고정, 막과의 상호작용, 및 기타 효과기 기능을 개선시키는 고정 영역내 변화, 또는 항원 결합 특성을 개선시키는 가변 영역내 변화를 포함한다. 본 발명의 조성물 및 방법은 촉매적 면역글로불린 또는 이의 단편을 추가로 포함할 수 있다.The compositions and methods of the present invention have been found to be useful in the production of immunoglobulins or fragments thereof, wherein the heavy or light chains are "mammals", "chimeras" or modified in ways that enhance their efficacy. Modified antibodies are both amino acid and nucleic acid sequence variants that retain the same biological activity in their unmodified form and are fixed regions that are modified to alter activity, i.e., complement complement, membrane interaction, and other effector functions. Or changes in variable regions that improve antigen binding properties. The compositions and methods of the present invention may further comprise catalytic immunoglobulins or fragments thereof.

"변이체" 면역글로불린-암호화 폴리뉴클레오타이드 서열은 참조 폴리펩타이드 서열로부터 하나 이상의 아미노산에 의해 변경된 "변이체" 면역글로불린 아미노산 서열을 암호화할 수 있다. 수반되는 이러한 동일한 논의는 목적한 다른 생물학적으로 활성인 단백질 서열(및 이들의 암호화 서열)에 적용가능하다. 변이체 폴리뉴클레오타이드 서열은 "보존적" 치환을 함유하는 변이체 아미노산 서열을 암호화할 수 있으며, 여기서 치환된 아미노산은 이것이 교체되는 아미노산과 유사한 구조적 또는 화학적 특성을 가진다. 목적한 단백질의 변이체는 천연적으로 존재하는 서열의 아미노산 서열과 실질적으로 동일한(적어도 약 80 내지 99% 동일하고, 이 사이의 모든 정수) 아미노산 서열을 사용하여 제조할 수 있으며, 이는 기능적으로 동등한, 3차원 구조를 형성하고 천연적으로 존재하는 단백질의 생물학적 활성을 보유한다. 특정 아미노산 치환이 단백질의 기능에 영향을 미치지 않고 단백질 서열내에서 이루어질 수 있음은 생물학 분야에 잘 공지되어 있다. 일반적으로, 보존적 아미노산 치환 또는 유사한 아미노산의 치환은 단백질 기능에 영향을 미치지 않고 용인된다. 유사한 아미노산은 크기 및/또는 하전 특성에 있어서 유사한 것들일 수 있는데, 예를 들면, 아스파르테이트와 글루타메이트 및 이소류신과 발린은 둘다 유사한 아미노산의 쌍이다. 하나의 다른 것으로의 치환은, 쳔연의 2차 및 3차 구조 형성이 의도된 것을 제외하고는 파괴되지 않을 경우 허용된다. 아미노산 쌍들 사이의 유사성은 다수의 방법으로 당해 분야에서 평가되어 왔다. 예를 들면, 본원에 참조로 인용된 문헌(참조: Dayhoff et al., in Atlas of Protein Sequence and Structure, 1978. Volume 5, Supplement 3, Chapter 22, pages 345-352)은 아미노산 유사성의 척도로서 사용될 수 있는 아미노산 치환에 대한 빈도 표(frequency table)를 제공한다. 다이호프(Dayhoff) 등의 빈도 표는 진화적으로 상이한 공급원의 다양성으로부터 동일한 기능을 갖는 단백질에 대한 아미노산 서열의 비교를 기초로 한다.A “variant” immunoglobulin-encoding polynucleotide sequence may encode a “variant” immunoglobulin amino acid sequence altered by one or more amino acids from a reference polypeptide sequence. This same discussion involved is applicable to other biologically active protein sequences (and their coding sequences) of interest. Variant polynucleotide sequences may encode variant amino acid sequences containing "conservative" substitutions, wherein the substituted amino acids have similar structural or chemical properties to the amino acids to which they are replaced. Variants of the protein of interest may be prepared using amino acid sequences that are substantially identical (at least about 80 to 99% identical, and all integers therebetween) with amino acid sequences of naturally occurring sequences, which are functionally equivalent, It forms a three-dimensional structure and retains the biological activity of naturally occurring proteins. It is well known in the biological arts that certain amino acid substitutions can be made within the protein sequence without affecting the function of the protein. In general, conservative amino acid substitutions or substitutions of similar amino acids are tolerated without affecting protein function. Similar amino acids can be similar in size and / or charge properties, for example aspartate and glutamate and isoleucine and valine are both pairs of similar amino acids. Substitution with one other is permitted unless the breakdown of the secondary secondary and tertiary structures is intended, unless intended. Similarity between amino acid pairs has been evaluated in the art in a number of ways. For example, Dayhoff et al., In Atlas of Protein Sequence and Structure, 1978. Volume 5, Supplement 3, Chapter 22, pages 345-352, incorporated herein by reference, can be used as a measure of amino acid similarity. Provides a frequency table of possible amino acid substitutions. Frequency tables by Dayhoff et al. Are based on comparisons of amino acid sequences for proteins having the same function from a variety of evolutionarily different sources.

기재된 뉴클레오타이드(및 아미노산) 서열의 치환 돌연변이, 삽입 및 결실 변이체는 당해 분야에 잘 공지된 방법에 의해 용이하게 제조될 수 있다. 이들 변이체는, 변이체가 본 발명의 구체적으로 예시된 서열과 실질적인 서열 동일성을 가지고 바람직한 기능성이 보존되는 한 구체적으로 예시된 서열과 동일한 방식으로 사용될 수 있다.Substitution mutations, insertions, and deletion variants of the described nucleotide (and amino acid) sequences can be readily prepared by methods well known in the art. These variants may be used in the same manner as specifically exemplified sequences so long as the variants have substantial sequence identity with the specifically exemplified sequences of the present invention and the desired functionality is preserved.

본원에 사용된 것으로서, 실질적인 서열 동일성은, 변이체 폴리뉴클레오타이드 또는 단백질이, 이로부터 변이체가 기원하는 폴리뉴클레오타이드 또는 단백질과 동일한 능력으로 기능하도록 하기에 충분한 상동성(또는 동일성)을 말한다. 바람직하게는, 이러한 서열 동일성은 70% 또는 80% 초과이며, 보다 바람직하게는, 이러한 동일성은 85% 초과이거나, 이러한 동일성은 90% 초과이고/이거나, 또는, 이는 95% 초과이고, 70 내지 100% 사이의 모든 정수이다. 기능에 있어 동등하거나 서열 또는 기타의 기능을 개선시키도록 설계된 치환 돌연변이, 삽입 돌연변이 및 결실 돌연변이를 제조하는 것이 방법론적 장점을 제공한다는 것은 당해 분야에서 숙련된 기술자의 기술내에 있다. 어떠한 천연적으로 존재하는 단백질을 판독할 수 있거나 정량화하는 선행분야 항목을 판독하는 양태/변이체도 특허청구된 바와 같은 본 발명의 영역내에 있는 것으로 의도되지 않는다. 본 발명의 폴리뉴클레오타이드 서열이 트렁케이트(truncate)되고/되거나 달리는 돌연변이됨으로써 원래의 완전한 길이의 서열의 특정의 수득되는 단편 및/또는 돌연변이체가 완전한 길이의 서열의 바람직한 특징을 보유할 수 있는 것은 당해 분야에 잘 공지되어 있다. 보다 큰 핵산 분자로부터 단편을 생성하는데 적합한 광범위한 제한 효소는 잘 공지되어 있다. 또한, Bal31 엑소뉴클레아제가 DNA의 시간-제어된 제한된 분해에 편리하게 사용될 수 있음은 잘 공지되어 있다[참조: 예를 들면, 본원에 참조로 인용된, Maniatis et al. 1982. Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York, pages 135-139). 또한, 문헌(참조: Wei et al. 1983. J. Biol. Chem. 258:13006-13512)을 참조한다. Bal31 엑소뉴클레아제(일반적으로 "erase-a-base" 과정으로 언급됨)의 사용에 의해, 당해 분야의 통상의 기술자는 대상체 핵산의 한쪽 끝 또는 양쪽 끝으로부터 뉴클레오타이드를 제거함으로써 대상체 뉴클레오타이드 서열에 대해 기능적으로 동등한 광범위한 스펙트럼의 단편을 생성할 수 있다. 당해 분야의 통상의 기술자는 이러한 방식으로 원래의 암호화 서열을 따라 위치로부터 제어된 변화하는 길이의 단편을 수백개 생성할 수 있다. 당해 분야의 통상의 기술자는 생성된 단편을 이들의 특징에 대해 통상적으로 시험하거나 스크리닝하고 본원에 교시된 바와 같은 단편의 유용성을 측정할 수 있다. 완전한 길이의 서열 또는 이의 단편의 돌연변이체 서열은 부위 지시된 돌연변이유발에 의해 용이하게 생산될 수 있음이 또한 잘 알려져 있다[참조: 예를 들면, 둘다 본원에 참조로 인용된, Larionov, O.A. and Nikiforov, V.G. 1982. Genetika 18:349-59; Shortle et al. (1981) Annu. Rev. Genet. 15:265-94]. 당해 분야의 통상의 기술자는 결실-, 삽입-, 또는 치환-유형 돌연변이를 통상적으로 생산하고 완전한 길이의 야생형 서열, 또는 이의 단편의 바람직한 특징을 함유하는 수득되는 돌연변이체, 예를 들면, 호르몬, 사이토킨, 항원-결합 또는 기타 생물학적 활성을 보유한 것들을 확인할 수 있다.As used herein, substantial sequence identity refers to sufficient homology (or identity) to allow the variant polynucleotide or protein to function in the same capacity as the polynucleotide or protein from which the variant originates. Preferably, such sequence identity is greater than 70% or 80%, more preferably such identity is greater than 85% or such identity is greater than 90% and / or it is greater than 95% and 70 to 100 All integers between%. It is within the skill of the person skilled in the art that making substitution mutations, insertion mutations and deletion mutations that are equivalent in function or designed to improve sequence or other function provides methodological advantages. No aspect / variant that reads prior art items that can read or quantify any naturally occurring protein is intended to be within the scope of the invention as claimed. It is known in the art that certain obtained fragments and / or mutants of the original full length sequence may retain the desired characteristics of the full length sequence by causing the polynucleotide sequences of the present invention to be truncated and / or otherwise mutated. Well known in A wide variety of restriction enzymes suitable for generating fragments from larger nucleic acid molecules are well known. It is also well known that Bal31 exonuclease can be conveniently used for time-controlled limited digestion of DNA. See, eg, Maniatis et al. 1982. Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York, pages 135-139). See also Wei et al. 1983. J. Biol. Chem. 258: 13006-13512. By the use of Bal31 exonuclease (commonly referred to as the "erase-a-base" process), one of ordinary skill in the art would be able to remove the nucleotide from one or both ends of the subject nucleic acid to A broad spectrum of fragments can be produced that are functionally equivalent. One skilled in the art can generate hundreds of fragments of controlled varying lengths from position along the original coding sequence in this manner. One skilled in the art can routinely test or screen the resulting fragments for their characteristics and determine the utility of the fragments as taught herein. It is also well known that mutant sequences of full length sequences or fragments thereof can be readily produced by site directed mutagenesis. See, eg, Larionov, O.A., both of which are incorporated herein by reference. and Nikiforov, V.G. 1982. Genetika 18: 349-59; Shortle et al. (1981) Annu. Rev. Genet. 15: 265-94. Those skilled in the art will routinely produce deletion-, insertion-, or substitution-type mutations and the resulting mutants, such as hormones, cytokines, which contain the desired characteristics of full-length wild-type sequences, or fragments thereof. , Those with antigen-binding or other biological activity can be identified.

또한, 또는 대안적으로, 변이체 폴리뉴클레오타이드 서열은 "비-보존적" 치환을 함유하는 변이체 아미노산 서열을 암호화할 수 있으며, 여기서 치환된 아미노산은, 이것이 교체되는 아미노산에 대해 상이한 구조적 또는 화학적 특성을 갖는다. 변이체 면역글로불린-암호화 폴리뉴클레오타이드는 또한 아미노산 삽입 또는 결실, 또는 둘다를 함유하는 변이체 아미노산 서열을 암호화할 수 있다. 또한, 변이체 "면역글로불린-암호화 폴리뉴클레오타이드"는 참조 폴리뉴클레오타이드 서열과 동일한 폴리펩타이드를 암호화할 수 있지만, 유전 코드의 축퇴성(degeneracy)으로 인해, 참조 폴리뉴클레오타이드 서열로부터 하나 이상의 염기가 변경된 폴리뉴클레오타이드 서열을 갖는다.In addition, or alternatively, the variant polynucleotide sequence may encode a variant amino acid sequence containing "non-conservative" substitutions, wherein the substituted amino acids have different structural or chemical properties relative to the amino acid to which they are replaced. . Variant immunoglobulin-encoding polynucleotides may also encode variant amino acid sequences containing amino acid insertions or deletions, or both. In addition, the variant “immunoglobulin-encoding polynucleotide” may encode the same polypeptide as the reference polynucleotide sequence, but due to the degeneracy of the genetic code, one or more bases modified from the reference polynucleotide sequence have been modified. Has

용어 "단편"은 본 발명의 재조합체 면역글로불린을 언급하는 경우, 상응하는 완전한 길이의 면역글로불린 단백질의 아미노산 서열 전부는 아니지만 이의 일부와 동일한 아미노산 서열을 갖는 폴리펩타이드를 의미하며, 이는 상응하는 완전한 길이의 단백질과 동일한 생물학적 기능 또는 활성을 필수적으로 보유하거나, 상응하는 완전한 길이의 단백질의 기능 또는 활성 중 적어도 하나를 보유한다. 단편은 바람직하게는 완전한 길이의 면역글로불린의 적어도 20 내지 100개의 연속된 아미노산 잔기를 포함하며, 바람직하게는 완전한 길이의 항체와 동일한 항원에 결합하는 능력을 보유한다.The term "fragment", when referring to a recombinant immunoglobulin of the present invention, refers to a polypeptide having an amino acid sequence identical to, but not all of, the amino acid sequence of a corresponding full length immunoglobulin protein, which is corresponding full length Essentially retain the same biological function or activity as the protein of, or at least one of the corresponding full-length protein. The fragment preferably comprises at least 20 to 100 contiguous amino acid residues of a full length immunoglobulin and preferably retains the ability to bind the same antigen as the full length antibody.

본원에 사용된 것으로서, 용어 "서열 동일성"은 서열 정렬 프로그램을 사용하여 정렬하는 경우 2개 이상의 정렬된 서열에 있어서 핵산 또는 아미노산 서열 동일성을 의미한다. 용어 "상동성 %"는, 본원에서의 용어 "동일성 %"와 본원에서 상호교환적으로 사용되며 서열 정렬 프로그램을 사용하여 정렬하는 경우, 2개 이상의 정렬된 서열 사이의 핵산 또는 아미노산 서열 동일성의 수준을 말한다. 예를 들면, 본원에서 사용된 것으로서, 80% 상동성은 당해 분야에서 이해되는 바와 같이 정의된 알고리즘에 의해 측정된 80% 서열 동일성과 동일한 것을 의미하며, 따라서, 제공된 서열의 상동성은 제공된 서열의 길이에 걸쳐 80% 초과의 서열 동일성을 갖는다.As used herein, the term “sequence identity” refers to nucleic acid or amino acid sequence identity in two or more aligned sequences when aligned using a sequence alignment program. The term "% homology" is used interchangeably with the term "% identity" herein and when aligned using a sequence alignment program, the level of nucleic acid or amino acid sequence identity between two or more aligned sequences. Say For example, as used herein, 80% homology means the same as 80% sequence identity measured by an algorithm defined as understood in the art, and thus, homology of a given sequence is dependent upon the length of the provided sequence. Greater than 80% sequence identity over.

비교용 서열의 최적 정렬은 예를 들면, 문헌(참조: Smith and Waterman. 1981. Adv. Appl. Math. 2:482)의 국소 상동성 알고리즘에 의해, 문헌(참조: Needleman and Wunsch. 1970. J Mol. Biol. 48:443)의 상동성 정렬 알고리즘에 의해, 문헌(참조: Pearson and Lipman. 1988. Proc. Natl. Acad. Sci. USA 85:2444)의 유사성 방법에 대한 조사에 의해, 이들 알고리즘[위스콘신주 매디슨 소재의 제네틱스 컴퓨터 그룹(Genetics Computer Group), 위스콘신 제네틱스 소프트웨어 패키지(Wisconsin Genetics software Package)내 GAP, BESTFIT, FASTA, 및 TFASTA]의 컴퓨터처리된 시행에 의해, 생명공학 정보를 위한 국립 센터 웹사이트(참조: nlm.nih.gov/)를 통해 공공 사용가능한 소프트웨어를 사용한 BLAST 알고리즘(참조: Altschul et al. 1990. J Mol. Biol. 215:403-410)에 의해, 또는 가시적 관측(참조: 일반적으로, Ausubel et al., 상기 참조)에 의해 수행될 수 있다. 본 발명의 목적을 위해, 비교용 서열의 최적 정렬은 문헌[참조: Smith and Waterman. 1981. Adv. Appl. Math. 2:482. 또한, Altschul et al. 1990 및 Altschul et al. 1997]의 국소 상동성 알고리즘에 의해 가장 바람직하게 수행된다.The optimal alignment of the comparative sequences is described, for example, by the local homology algorithm of Smith and Waterman. 1981. Adv. Appl. Math. 2: 482, Needleman and Wunsch. 1970. J By the homology alignment algorithm of Mol. Biol. 48: 443), these algorithms are investigated by the similarity method of Pearson and Lipman. 1988. Proc. Natl. Acad. Sci. USA 85: 2444. National Center for Biotechnology Information by Computerized Implementation of GAP, BESTFIT, FASTA, and TFASTA in the Genetics Computer Group of Madison, Wisconsin, the Wisconsin Genetics Software Package By the BLAST algorithm (see Altschul et al. 1990. J Mol. Biol. 215: 403-410) using publicly available software via the website (nlm.nih.gov/) or by visual observation (cf. Generally, by Ausubel et al., Supra) There. For the purposes of the present invention, optimal alignment of comparative sequences is described in Smith and Waterman. 1981. Adv. Appl. Math. 2: 482. In addition, Altschul et al. 1990 and Altschul et al. Most preferably by a local homology algorithm.

2개 이상의 핵산 또는 단백질 서열과 관련하여 용어 "동일한" 또는 "동일성" 퍼센트는 본원에 기술된 서열 비교 알고리즘, 예를 들면, 스미쓰-워터맨 알고리즘(Smith-Waterman algorithm), 당해 분야에 공지된 다른 것들, 예를 들면, BLAST, 또는 가시적 관측을 사용하여 측정된 것으로서, 최대 상응성에 대해 비교하고 정렬하는 경우, 동일하거나, 동일한 아미노산 잔기 또는 뉴클레오타이드의 규정된 퍼센트를 갖는 2개 이상의 서열 또는 소서열(subsequence)을 말한다.The term “identical” or “identity” percentages with respect to two or more nucleic acid or protein sequences is defined by the sequence comparison algorithm described herein, eg, the Smith-Waterman algorithm, others known in the art. Two or more sequences or subsequences having a defined percentage of identical or identical amino acid residues or nucleotides, when compared and aligned for maximum correspondence, as measured using, for example, BLAST, or visual observation. Say).

본 발명에 따라서, 천연 또는 참조 서열에 대해 80, 85, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%(및 퍼센트 값에 대해 80 내지 100 사이의 모든 정수) 이상의 서열 동일성을 갖는 자가-프로세싱 절단 폴리펩타이드 및 폴리펩타이드 자체를 암호화하는 서열 변이체가 또한 포함된다. 또한, 적어도 5, 적어도 10, 또는 적어도 15 단위의 연속된 신장을 나타내는 폴리펩타이드의 아미노산 단편; 및 기재된 동일성 조건에 따른 이들의 상동 단편; 및 적어도 15, 적어도 30, 또는 적어도 45 단위의 연속된 신장을 나타내는 핵산 서열의 단편이 포함된다. 특수 양태에서, 핵산 서열 또는 아미노산 서열은 본원에 기술된 각각의 서열에 대해 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5% 동일하다.In accordance with the present invention, 80, 85, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% (and between 80 and 100 for percent values) relative to a native or reference sequence Also included are self-processing cleavage polypeptides having sequence identity of at least all integers) and sequence variants encoding the polypeptide itself. In addition, amino acid fragments of a polypeptide exhibiting contiguous elongation of at least 5, at least 10, or at least 15 units; And homologous fragments thereof according to the described identity conditions; And fragments of nucleic acid sequences exhibiting consecutive stretches of at least 15, at least 30, or at least 45 units. In a particular embodiment, the nucleic acid sequence or amino acid sequence is 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or, for each sequence described herein 99.5% equal.

핵산 서열은, 2개의 서열이 중간 내지 고 스트링전시(stringency) 하이브리드화 및 세척 조건하에서 다른 것에 대해 특이적으로 하이브리드화하는 경우 참조 핵산 서열에 대해 "선택적으로 하이브리드화할 수 있는" 것으로 고려된다. 하이브리드화 조건은 핵산 결합 복합체 또는 프로브의 용융 온도(Tm)를 기초로 한다. 예를 들면, "최대 스트링전시"는 전형적으로 약 Tm-5℃(프로브의 Tm의 5℃ 미만)에서 발생하며; "고 스트링전시"는 Tm 미만의 약 5 내지 10℃ 미만에서 발생하고; "중간 스트링전시"는 프로브의 Tm 미만의 약 10 내지 20℃ 미만에서 발생하며; "저 스트링전시"는 Tm 미만의 약 20 내지 25℃ 미만에서 발생한다. 기능적으로, 최대 스트링전시 조건을 사용하여 하이브리드화 프로브와 엄격한(strict) 동일성 또는 거의 엄격한 동일성을 갖는 서열을 확인할 수 있는 반면; 고 스트링전시 조건을 사용하여 프로브와 약 80% 이상 서열 동일성을 갖는 서열을 확인한다.Nucleic acid sequences are considered to be "selectively hybridizable" to the reference nucleic acid sequence when the two sequences specifically hybridize to others under medium to high stringency hybridization and wash conditions. Hybridization conditions are based on the melting temperature (Tm) of the nucleic acid binding complex or probe. For example, “maximum string display” typically occurs at about Tm-5 ° C. (less than 5 ° C. of the Tm of the probe); “High string display” occurs at about 5-10 ° C. below Tm; “Intermediate string display” occurs at about 10-20 ° C. below the Tm of the probe; “Low string display” occurs at about 20-25 ° C. below Tm. Functionally, maximum stringency conditions can be used to identify sequences with strict or near strict identity with hybridization probes; High stringency conditions are used to identify sequences that have at least about 80% sequence identity with the probe.

중간 및 고 스트링전시 하이브리드화 조건은 당해 분야에 잘 공지되어 있다(참조: 예를 들면, Sambrook, et al, 1989, Chapters 9 and 11, 및 Ausubel, F. M., et al., 1993). 고 스트링전시 조건의 예는 50% 포름아미드, 5X SSC, 5X 덴하르트 용액(Denhardt's solution), 0.5% SDS 및 100 ㎍/ml 변성된 담체 DNA 중의 약 42℃에서의 하이브리드화에 이은 2X SSC 및 0.5% SDS 중의 실온으로 2회의 세척 및 42℃에서 0.1 X SSC 및 0.5% SDS 중의 추가로 2회 세척을 포함한다. 목적한 천연적으로 존재하는 단백질과 동일한 생물학적 활성을 가진 폴리펩타이드를 암호화하고 중간 내지 고 스트링전시 하이브리드화 조건하에서 하이브리드화하는 2A 서열 변이체가 본 발명의 영역내에 있는 것으로 고려된다.Medium and high stringency hybridization conditions are well known in the art (see, eg, Sambrook, et al, 1989, Chapters 9 and 11, and Ausubel, F. M., et al., 1993). Examples of high stringency conditions include hybridization at about 42 ° C. in 50% formamide, 5X SSC, 5X Denhardt's solution, 0.5% SDS and 100 μg / ml denatured carrier DNA followed by 2X SSC and 0.5 Two washes to room temperature in% SDS and an additional two washes in 0.1 X SSC and 0.5% SDS at 42 ° C. It is contemplated that within the scope of the invention are 2A sequence variants that encode polypeptides having the same biological activity as the naturally occurring proteins of interest and hybridize under medium to high stringency hybridization conditions.

유전 코드의 축퇴성의 결과로서, 이러한 구조적 성분, 자가-프로세싱 성분, 예를 들면, 인테인, 조절 성분들, 예를 들면, 시그날 펩티다제 절단 서열, 또는 다른 성분들을 포함하는, 동일한 펩타이드 서열을 암호화하는 다수의 암호화 서열이 생산될 수 있다. 예를 들면, 삼중자(triplet) CGT는 아미노산 아르기닌을 암호화한다. 아르기닌은 대안적으로 삼중자 뉴클레오타이드 서열 CGA, CGC, CGG, AGA, 및 AGG에 의해 암호화된다. 따라서, 암호화 영역내 동의어 코돈의 이러한 치환은 본 발명에 의해 포함되는 서열 변이체내에 속하는 것으로 인식된다.As a result of the degeneracy of the genetic code, the same peptide sequence, including such structural components, self-processing components such as inteins, regulatory components such as signal peptidase cleavage sequences, or other components Multiple coding sequences can be produced that encode. For example, triplet CGT encodes the amino acid arginine. Arginine is alternatively encoded by the triplet nucleotide sequences CGA, CGC, CGG, AGA, and AGG. Thus, such substitutions of synonymous codons in the coding region are recognized to fall within the sequence variants encompassed by the present invention.

이러한 서열 변이체가 고 스트링전시 조건하에서 모 서열(parent sequence)에 하이브리드화될 수 있거나 될수 없음은 또한 인식된다. 이는 예를 들면, 서열 변이체가 모 뉴클레오타이드(parent nucleotide)에 의해 암호화된 아미노산 각각에 대한 상이한 코돈을 포함하는 경우 가능할 수 있다. 이러한 변이체는 그럼에도 불구하고, 본 발명에 의해 구체적으로 고려되고 포함된다.It is also recognized that such sequence variants may or may not hybridize to the parent sequence under high stringency conditions. This may be possible, for example, if the sequence variants contain different codons for each of the amino acids encoded by the parent nucleotides. Such variants are nevertheless specifically considered and included by the present invention.

치료제 양식으로서 항체의 잠재성은 생산 능력 및 현재의 기술의 비용에 의해 현재 제한된다. 면역글로불린(또는 다른 단백질) 생산을 위한 개선된 바이러스 또는 비-바이러스 단일 발현 벡터는 2개 이상의 암호화 서열, 즉, 단일 벡터로부터 이중- 또는 다중-특이성을 갖는 다른 단백질 또는 면역글로불린의 발현 및 전달을 용이하게 한다. 본 발명은 일본쇄 항체, 완전한 길이의 항체 또는 항체 단편, 2개 쇄 호르몬, 2개 쇄 사이토킨, 2개 쇄 케모킨, 2개 쇄 수용체 등과 같은 가공된 항체를 포함하는, 본원에 추가로 상세히 설명된 바와 같은 어떠한 면역글로불린(즉, 항체) 또는 이의 단편 또는 다른 다중부분 단백질 또는 결합 단백질 쌍에 적용가능하다.The potential of antibodies as therapeutic modalities is currently limited by production capacity and the cost of current technology. Improved viral or non-viral single expression vectors for immunoglobulin (or other protein) production are capable of expressing and delivering two or more coding sequences, i.e., other proteins or immunoglobulins with dual- or multi-specificity from a single vector. To facilitate. The invention is further described herein in detail, including processed antibodies such as single chain antibodies, full length antibodies or antibody fragments, two chain hormones, two chain cytokines, two chain chemokines, two chain receptors, and the like. It is applicable to any immunoglobulin (ie, antibody) or fragment thereof or other multipart protein or binding protein pair as described.

인테인Intaine

본원에 사용된 것으로서, 인테인(Intein)은 N-엑스테인에 의해 주요 발현 생성물의 N-말단을 향해 결합되고 C-엑스테인에 의해 주요 발현 생성물의 C-말단을 향해 결합된, 발현된 단백질내 분절이다. 천연적으로 존재하는 인테인은 인테인의 절제 및 N- 및 C-엑스테인의 재결합(단백질 연결)을 매개한다. 그러나, 본 발현 생성물과 관련하여, 인테인 또는 플랭킹 엑스테인 아미노산 서열의 주요 서열은, 단백질 골격의 절단이 엑스테인의 연결의 부재 또는 이의 감소되거나 최소량에서 발생하도록 함으로써 엑스테인 단백질이 이들이 연결되어 융합 단백질을 형성하지 않고 주요 해독 생성물(폴리프로테인)로부터 방출되도록 하는 것이다. 주요 발현 생성물(어떠한 단백질 분해적 절단 전에, mRNA에 의해 합성된 단백질)의 인테인 부위는 N-엑스테인/인테인에서 단백질분해적 절단 및 인테인/C-엑스테인 연결을 매개한다. 일반적으로, 천연적으로 존재하는 인테인은 또한 N-엑스테인 및 C-엑스테인(의 펩타이드 결합의 형성에 의한 연결)과 함께 스플라이싱을 매개한다. 그러나, 본 발명에서 2개의 폴리펩타이드를 발현시키는 목표에 적용되는 바와 같이(항체 분자의 중쇄 및 경쇄에 의해 구체적으로 예시되는 바와 같이), 단백질 연결이 발생하지 않는 것이 바람직하다. 이는 연결 활성을 갖지 않는 돌연변이를 통해 또는 천연적으로 인테인을 혼입시킴에 의해 달성될 수 있다. 또는, 스플라이싱은 방출된 단백질의 연결을 예방하기 위한 스플라이싱 부위에서 또는 당해 부위 다음에 아미노산(들)을 변화시키기 위한 돌연변이에 의해 방지될 수 있다(참조: Xu and Perler, 1996, EMBO J. 15:5146-5153). 예를 들면, Ser, Thr 또는 Cys는 C-엑스테인의 개시부에서 정상적으로 발생하며 스플라이싱을 수정하거나 차단하도록 변화될 수 없다. 특수한 인테인에서, 스플라이싱에 대한 효과는 발현된 단백질의 연결을 방지하거나 감소시킨다.As used herein, intein is an expressed protein that is bound towards the N-terminus of the main expression product by N-extein and towards the C-terminus of the main expression product by C-extein. My segment is Naturally present inteins mediate ablation of intein and recombination of N- and C-exteins (protein linkages). However, with respect to the present expression product, the main sequence of the intein or flanking extein amino acid sequence is such that the cleavage of the protein backbone occurs in the absence or reduced or minimal amount of the linkage of the extein, thereby linking the extein protein to them. It is intended to be released from the main translation product (polyprotein) without forming a fusion protein. The intein region of the main expression product (the protein synthesized by mRNA, before any proteolytic cleavage) mediates proteolytic cleavage and intein / C-extein linkages in the N-extein / intein. In general, naturally occurring inteins also mediate splicing together with N-extein and C-extein (linking by the formation of peptide bonds). However, as applied to the goal of expressing two polypeptides in the present invention (as specifically illustrated by the heavy and light chains of the antibody molecule), it is preferred that no protein linkage occurs. This can be accomplished through mutations that do not have linking activity or by incorporating intein naturally. Alternatively, splicing can be prevented by mutations to change the amino acid (s) at or after the splicing site to prevent linkage of the released protein (Xu and Perler, 1996, EMBO). J. 15: 5146-5153). For example, Ser, Thr or Cys occurs normally at the beginning of C-extein and cannot be altered to modify or block splicing. In particular inteins, the effect on splicing prevents or reduces the ligation of expressed proteins.

인테인은, 이의 유전자들이 다른 단백질의 유전자내에서만 발견되는 단백질의 부류이다. 엑스테인으로 명명된 플랭킹된 숙주 유전자와 함께, 인테인은 단일 mRNA로 전사되고, 단일 폴리펩타이드로서 해독된다. 후-해독적으로, 인테인은 자가촉매적 현상을 개시함으로써 자체를 제거하고 플랭킹된 숙주 단백질 분절을, 새로운 폴리펩타이드 결합을 사용하여 연결시킨다. 당해 반응은 인테인에 의해서 단독으로 촉매되며 다른 세포 단백질, 보조-인자 또는 ATP를 필요로 하지 않는다. 인테인은 다양한 단세포 유기체내에서 발견되며 이들은 크기가 상이하다. 많은 인테인은 게놈내 이들의 이동성을 위해 계수되는 엔도뉴클레아제 도메인을 함유한다.Inteins are a class of proteins whose genes are found only in the genes of other proteins. Together with the flanking host genes named exteins, the intein is transcribed into a single mRNA and translated as a single polypeptide. Post-detoxification, the intein removes itself by initiating autocatalytic phenomena and connects the flanking host protein segments with new polypeptide bonds. The reaction is catalyzed solely by intein and does not require other cellular proteins, co-factors or ATP. Inteins are found in a variety of single cell organisms and they differ in size. Many inteins contain endonuclease domains that are counted for their mobility in the genome.

인테인 매개된 반응은 생물공학에서, 특히 정제 및 단백질 칩 작제와 같은 시험관내 셋팅에서, 및 식물 균주 개선에서 사용되어 왔다[참조: Perler, F.B. 2005. IUBMB Life 57(7):469-76]. 돌연변이는 천연의 인테인 뉴클레오타이드 서열내로 도입되며, 이들 돌연변이체중 일부는 변경된 특성을 가진 것으로 보고되어 있다[참조: Xu and Perler, 1996. EMBO J. 15(9), 5146-5153]. 인테인, 즉, 세균 인테인-유사(BIL) 도메인 및 헷지훅(hedgehog)(Hog) 자가-프로세싱 도메인 외에, Hog/인테인(HINT) 상과의 다른 2개의 구성원들은 또한 유사한 메카니즘을 통해 해독후 자가-프로세싱을 촉매하는 것으로 알려져 있다[참조: Dassa et.al. 2004. J. Biol. Chem. 279(31):32001-32007].Intein mediated reactions have been used in biotechnology, in particular in vitro settings such as purification and protein chip construction, and in plant strain improvement. Perler, F.B. 2005. IUBMB Life 57 (7): 469-76. Mutations are introduced into native intein nucleotide sequences and some of these mutants have been reported to have altered properties (Xu and Perler, 1996. EMBO J. 15 (9), 5146-5153). In addition to the intein, ie the bacterial intein-like (BIL) domain and the hedgehog (Hog) self-processing domain, the other two members of the Hog / intein phase are also deciphered through similar mechanisms. It is known to catalyze post self-processing. See Dassa et.al. 2004. J. Biol. Chem. 279 (31): 32001-32007.

인테인은 특이적인 숙주 단백질내에서 프레임내 삽입으로 발생한다. 자가-스플라이싱 반응에서, 인테인은 전구체 단백질로부터 자체 절제되는 반면, 플랭킹 영역, 엑스테인은 연결되어 숙주 유전자 기능을 회복한다. 이들 성분들은 또한 게놈내에서 이들의 이동성을 위해 계수되는 엔도뉴클레아제 기능을 함유한다. 인테인은 다양한 크기(134 내지 1650개 아미노산)에서 발생하며, 이들은 유박테리아(eubacteria), 유카리오타(eukaryota) 및 아르카에아(archaea)의 게놈내에서 확인되어 왔다. 모델 스플라이싱/리포터 시스템을 사용한 실험은, 엔도뉴클레아제, 단백질 절단, 및 단백질 스플라이싱 기능이 분리될 수 있음을 밝혔다(참조: Xu and Perler. 1996. EMBO J. 15:5146-5153). 하기 기술된 실시예는 피로코쿠스 호리코시이(Pyrococcus horikoshii) Pho Pol I, 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) VMA, 및 시네초시스티스 아종(Synechocystis spp .)으로부터의 인테인을 사용하여 항체 중쇄 및 경쇄로부터의 서열과 함께 융합 단백질을 생성한다. 인테인의 스플라이싱 능력을 제거하도록 설계된 인테인의 돌연변이는, 자가-절단하여 정확하게 암호화된 항체 중쇄 및 경쇄를 생산하는 일본쇄 폴리펩타이드를 생성한다. 이러한 전략은 다른 다중쇄 단백질, 호르몬 또는 사이토킨의 발현에 유사하게 사용될 수 있으며, 이는 또한 이들의 성숙한, 생물학적으로 활성인 형태에 대한 전구체 단백질(프로단백질)의 프로세싱을 위해 조정될 수 있다. 피로코쿠스 호리코시이 Pho Pol I, 에스. 세레비지아에 VMA, 및 시네초시스티스 아종 인테인의 사용은 본원에 구체적으로 예시되어 있으나, 당해 분야에 공지된 다른 인테인을 본 발명의 폴리프로테인 발현 벡터 및 방법에 사용할 수 있다.Inteins occur by in-frame insertion in specific host proteins. In a self-splicing reaction, the intein is self-resected from the precursor protein, while the flanking region, the extein, is linked to restore host gene function. These components also contain endonuclease functions that are counted for their mobility in the genome. Inteins occur at various sizes (134-1650 amino acids) and they have been identified in the genomes of eubacteria, eukaryota and arcaea. Experiments using the model splicing / reporter system have shown that endonucleases, protein cleavage, and protein splicing functions can be isolated (Xu and Perler. 1996. EMBO J. 15: 5146-5153 ). The examples described below include Pyrococcus horikoshii ) Pho Pol I, Saccharomyces cerevisiae ) VMA, and Synechocystis spp . Inteins from) are used to generate fusion proteins with sequences from antibody heavy and light chains. Mutations in intein designed to eliminate the splicing ability of intein result in single-chain polypeptides that self-cleavage to produce correctly encoded antibody heavy and light chains. This strategy can be used similarly for the expression of other multichain proteins, hormones or cytokines, which can also be tailored for the processing of precursor proteins (proproteins) for their mature, biologically active forms. Pyrococcus horikoshii Pho Pol I, S. The use of VMA, and cinechocytis subspecies inteins in cerevisiae is specifically illustrated herein, but other inteins known in the art can be used in the polyprotein expression vectors and methods of the present invention.

파이로코쿠스 호리코시이 Pho Pol I, 에스. 세레비지아에 VMA, 및 시네초시스티스 아종 인테인 외에 많은 다른 인테인이 당해 분야에 공지되어 있다[참조: 예를 들면, Perler, F.B. 2002, InBase, the Intein Database, Nucl. Acids Res. 30(1):383-384 and the Intein Database and Registry, available via the New England Biolabs website, e.g., at http://tools.neb.com/inbase/]. 인테인은 효모, 마이코박테리아 및 극도의 호열성 아르카에박테리아(thermophilic archaebacteria)와 같은 광범위한 유기체에서 확인되어 왔다. 특정의 인테인은 엔도뉴크레아제 활성 및 부위-특이적인 단백질 절단 및 스플라이싱 활성을 갖는다. 엔도뉴클레아제 활성은 본 발명의 실시에 필수적이지 않으며; 엔도뉴클레아제 암호화 영역은 결실될 수 있고, 단, 단백질 분해 활성은 유지되도록 제공된다.Pyrococcus horikoshii Pho Pol I, S. Many other inteins are known in the art in addition to VMA in cerevisiae, and cinechosis subspecies intein. See, eg, Perler, F.B. 2002, InBase, the Intein Database, Nucl. Acids Res. 30 (1): 383-384 and the Intein Database and Registry, available via the New England Biolabs website, e.g., at http://tools.neb.com/inbase/]. Inteins have been identified in a wide range of organisms such as yeast, mycobacteria and extremely thermophilic archaebacteria. Certain intaines have endonuclease activity and site-specific protein cleavage and splicing activity. Endonuclease activity is not essential to the practice of the present invention; The endonuclease coding region may be deleted provided that the proteolytic activity is maintained.

단백질 스플라이싱 공정의 메카니즘은 매우 상세히 연구되어 왔으며(참조: Chong et al. 1996. J. Biol. Chem. 271 : 22159-22168; Xu and Perler. 1996. EMBO J 15: 5146-5153), 보존된 아미노산은 인테인 및 엑스테인 스플라이싱 지점에서 발견되어 왔다(참조: Xu et al. 1994. EMBO J 13:5517-5522). 본원에 기술된 특정의 작제물은 제1의 암호화 서열의 3'-말단에 융합된 인테인 서열과, 인테인의 C-말단에서 프레임내 융합된 제2의 암호화 서열을 함유한다. 적합한 인테인 서열은 단백질 스플라이싱 성분을 함유하는 것으로 공지된 단백질 중 어느 것으로부터도 선택될 수 있다. 모든 공지된 인테인을 함유하는 데이타베이스는 월드 와이드 웹(World Wide Web)(참조: Perler, F. B. 1999. Nucl. Acids Res. 27: 346-347)으로부터 찾을 수 있다. 인테인 암호화 서열은 제2의 암호화 서열의 5' 말단에 대해 3' 말단에서 융합(프레임내)된다. 특정 기관에 대한 당해 단백질의 표적화를 위해, 적절한 펩타이드 시그날을 단백질의 암호화 서열에 융합시킬 수 있다.The mechanism of the protein splicing process has been studied in great detail (Chong et al. 1996. J. Biol. Chem. 271: 22159-22168; Xu and Perler. 1996. EMBO J 15: 5146-5153). Amino acids have been found at the intein and extein splicing sites (Xu et al. 1994. EMBO J 13: 5517-5522). Certain constructs described herein contain an intein sequence fused at the 3′-end of the first coding sequence and a second coding sequence fused in-frame at the C-terminus of the intein. Suitable intein sequences can be selected from any of the proteins known to contain protein splicing components. Databases containing all known inteins can be found from the World Wide Web (Perler, F. B. 1999. Nucl. Acids Res. 27: 346-347). The intein coding sequence is fused (in-frame) at the 3 'end to the 5' end of the second coding sequence. For targeting of the protein to a particular organ, the appropriate peptide signal can be fused to the coding sequence of the protein.

제2의 엑스테인 암호화 서열 후에, 인테인 암호화 서열-엑스테인 암호화 서열은 동일한 세포내에서 다수의 단백질의 발현에 바람직한 경우와 같이 흔히 반복될 수 있다. 다중-인테인 함유 작제물을 위해, 상이한 공급원으로부터 인테인 성분들을 사용하는 것이 유용할 수 있다. 최종 유전자의 서열이 발현된 후, 전사 말단 서열 및 유리하게는 폴리아데닐화 서열을 포함하는 것을 바람직하게 삽입한다. 폴리아데닐화 서열 및 말단 서열의 순서는 당해 분야에 이해된 바와 같을 수 있다. 양태에서, 폴리아데닐화 서열은 말단 서열을 선행할 수 있다.After the second extein coding sequence, the intein coding sequence-extein coding sequence can be repeated as often as desired for the expression of multiple proteins in the same cell. For multi-intein containing constructs, it may be useful to use intein components from different sources. After the sequence of the final gene is expressed, it is preferably inserted comprising a transcription terminal sequence and advantageously a polyadenylation sequence. The order of the polyadenylation sequence and the terminal sequence can be as understood in the art. In an aspect, the polyadenylation sequence may precede the terminal sequence.

변형된 인테인 스플라이싱 단위는, 이러한 목적하는 변형된 인테인이 인테인으로부터 엑스테인의 절제를 촉매할 수 있지만 엑스테인의 연결을 촉매할 수 없도록 설계되어 있다(참조: 예를 들면, 미국 특허 제7026526호 및 미국 특허 공보 제20020129400호). 파이로코쿠스 종 GB-D DNA 폴리머라제에서 C-말단 엑스테인 연결부의 돌연변이유발은 엑스테인의 절단을 유도하지만 엑스테인의 후속적인 연결을 방지하는 변경된 스플라이싱 성분을 생산하였다(참조: Xu and Perler. 1996. EMBO J 15: 5146-5153). 세린 538의 알라닌 또는 글리신으로의 돌연변이(Ser에서 Ala 또는 Gly으로)는 절단을 유도하였지만 연결을 방지하였다. 이러한 위치에서 Ser에서 Met으로 또는 Ser에서 Thr으로를 또한 사용하여 별도의 분절로 절단되고 적어도 부분적으로 재-연결되지 않는 폴리프로테인의 발현을 달성한다. 다른 인테인 스플라이싱 단위에서 동등한 잔기의 돌연변이는 또한 인테인에 대한 C-말단 엑스테인 연결부에서 아미노산의 상대적인 보존으로 인하여 엑스테인 분절의 연결을 방지할 수 있다. 저 보존/상동성의 예에서, 예를 들면, 제1의 몇개, 예를 들면, 약 5개의 C-엑스테인의 잔기 및/또는 인테인 분절의 마지막 몇개의 잔기가 전신적으로 변화되어 제공된 엑스테인 분절, 특히 본원에 기재되고 당해 분야에 이해되는 바와 같은 엑스테인 분절의 스플라이싱이 아닌 절단을 지지하는 능력에 대해 스크리닝된다. 엔도뉴클레아제 도메인을 함유하지 않는 인테인이 존재하며; 이들은 시네초시스티스 아종(Synechocystis spp) dnaE 인테인 및 마이코박테리움 제노피(Mycobacterium xenopi) GyrA 단백질(참조: Magnasco et al, Biochemistry, 2004, 43, 10265-10276; Telenti et al. 1997. J. Bacteriol. 179: 6378-6382)를 포함한다. 다른 것들은 천연적으로 발견되어 왔거나 엔도뉴클레아제-함유 인테인을 암호화하는 서열로부터 엔도뉴클레아제 암호화 도메인을 제거함에 의해 인공적으로 생성하여 왔다(참조: Chong et al. 1997. J. Biol. Chem. 272: 15587-15590). 바람직한 경우, 인테인은 마이코박테리움 제노피 GyrA 단백질로부터의 인테인과 같은 스플라이싱 기능을 수행하는데 요구된 최소 수의 아미노산으로 이루어지도록 하기 위해 원래 선택된다(참조: Telenti et al. 1997. 상기 참조). 대안적 양태에서, 엔도뉴클레아제 도메인을 제거하도록 변형된 마이코박테리움 제노피 GyrA 단백질로부터의 인테인 또는 사카로마이세스 세레비지아에 VMA 인테인과 같이, 엔도뉴클레아제 활성이 없는 인테인이 선택된다(참조: Chong et al. 1997. 상기 참조).Modified intein splicing units are designed such that this desired modified intein can catalyze the ablation of extein from the intein but not catalyze the linkage of the extein (see, eg, US Patent no. 6,526,6 and US Patent Publication No. 20020129400. Mutagenesis of the C-terminal extein linkage in Pyrococcus spp. GB-D DNA polymerase produced an altered splicing component that induces cleavage of the extein but prevents subsequent linkage of the extein (see Xu and Perler. 1996. EMBO J 15: 5146-5153). Mutations of aserine or glycine (from Ser to Ala or Gly) of serine 538 induced cleavage but prevented linkage. Ser to Met or Ser to Thr at these positions are also used to achieve expression of polyproteins that are cleaved into separate segments and are not at least partially re-linked. Mutations of equivalent residues in other intein splicing units can also prevent linkage of the extein segment due to the relative conservation of amino acids at the C-terminal extein linkage to the intein. In the example of low conservative / homologous, for example, an extein segment provided with a systemic alteration of the residues of the first few, for example about 5 C-exteins, and / or the last few residues of the intein segment In particular, for the ability to support non-splicing of the extein segments as described herein and as understood in the art. There is an intein that does not contain an endonuclease domain; These are the Synechocystis spp dnaE intein and Mycobacterium xenopi GyrA proteins (Magnasco et al, Biochemistry, 2004, 43, 10265-10276; Telenti et al. 1997. Bacteriol. 179: 6378-6382). Others have been found in nature or have been artificially produced by removing endonuclease coding domains from sequences encoding endonuclease-containing inteins (Chong et al. 1997. J. Biol. Chem. 272: 15587-15590. If desired, the intein was originally selected to consist of the minimum number of amino acids required to perform splicing functions such as intein from the Mycobacterium genophyte GyrA protein (Telenti et al. 1997. See above). In an alternative embodiment, phosphorus without endonuclease activity, such as intein from Mycobacterium genophyte GyrA protein modified to remove endonuclease domain or VMA intein to Saccharomyces cerevisiae Tayne is selected (Chong et al. 1997. see above).

인테인 스플라이싱 단위의 추가의 변형은, 절단 반응의 반응 속도가 변경되도록 함으로써, 단백질 용량이 스플라이싱 단위의 유전자 서열을 단순히 변형시킴에 의해 제어되도록 할 수 있다.Further modifications of the intein splicing unit can cause the protein dose to be controlled by simply modifying the gene sequence of the splicing unit by causing the reaction rate of the cleavage reaction to be altered.

하나의 양태에서, C-말단 엑스테인의 제1 잔기는 파이로코쿠스 종 GB-D DNA폴리머라제를 사용한 엑스테인 연결을 방지하는 것으로 밝혀진 변형인, 글리신 또는 알라닌을 함유하도록 가공된다(참조: Xu and Perler. 1996. EMBO J 15: 5146-5153). 당해 양태에서, 바람직한 C-말단 엑스테인 단백질은 글리신 또는 알라닌 잔기에 이어서 천연의 아미노산 서열내에 N-말단 메티오닌을 천연적으로 함유한다. 엑스테인의 글리신 또는 알라닌의 인테인의 C-말단에 대한 융합은 폴리프로테인의 프로세싱 후 천연 아미노산 서열을 제공한다. 다른 양태에서, 인공 글리신 또는 알라닌은 천연 서열을 변경시키거나 추가의 아미노산 잔기를 천연 서열의 N-말단에 가함에 의해 C-말단 엑스테인에 위치시킨다. 당해 양태에서, 단백질의 천연 아미노산 서열은 폴리프로테인 프로세싱 후 하나의 아미노산에 의해 변경될 것이다. 추가의 양태에서, 본 발명에 유용한 다른 변형이 제US 7026526호에 기술되어 있다.In one embodiment, the first residue of the C-terminal extein is processed to contain glycine or alanine, a modification that has been found to prevent extein linkage using pyrococcus species GB-D DNA polymerase (see Xu and Perler. 1996. EMBO J 15: 5146-5153). In this embodiment, the preferred C-terminal extein protein naturally contains a glycine or alanine residue followed by an N-terminal methionine in its natural amino acid sequence. Fusion of the extein glycine or alanine to the C-terminus of the intein provides a natural amino acid sequence after processing of the polyprotein. In other embodiments, artificial glycine or alanine is located in the C-terminal extein by altering the native sequence or adding additional amino acid residues to the N-terminus of the native sequence. In this embodiment, the natural amino acid sequence of the protein will be altered by one amino acid after polyprotein processing. In a further aspect, other variations useful in the present invention are described in US 7026526.

하나의 양태에서, 인테인은 미국 특허 제7,026,526호에서와 같은 것에 따른다. 특수 양태에서, 인테인은 파이로코쿠스 종 GB-D DNA 폴라머라제 인테인이다. 하나의 양태에서, C-말단 엑스테인 세린의 알라닌 또는 글리신으로의 돌연변이는 폴리프로테인의 절제를 촉진할 수 있지만 엑스테인 단위의 연결을 촉진하지 않는 변형된 인테인 스플라이싱 성분을 형성한다. 하나의 양태에서, 인테인은 미국 특허 제7,026,526호의 마이코박테리움 제노피 GyrA 최소 인테인이다. 하나의 양태에서, C-말단 엑스테인 트레오닌의 알라닌 또는 글리신으로의 돌연변이는 폴리프로테인의 절제를 촉진하지만 엑스테인 단위를 연결시키지 않는 변형된 인테인 스플라이싱 성분을 형성한다.In one embodiment, the intein is according to the same as in US Pat. No. 7,026,526. In a particular embodiment, the intein is Pyrococcus spp. GB-D DNA polymerase intein. In one embodiment, the mutation of the C-terminal extein serine to alanine or glycine forms a modified intein splicing component that can promote excision of the polyprotein but does not promote linkage of the extein units. In one embodiment, the intein is the Mycobacterium genophyte GyrA minimal intein of US Pat. No. 7,026,526. In one embodiment, the mutation of the C-terminal extein threonine to alanine or glycine forms a modified intein splicing component that promotes ablation of the polyprotein but does not link the extein units.

본원에 기술된 바와 같은 특정의 인테인의 경우, 작제 및 방법의 양태들이 특히 항체를 포함하는 다합체성 단백질에 대해 분비된 단백질 생성물의 개선된 발현을 생성할 수 있음은 인식될 것이다.It will be appreciated that for certain inteins as described herein, embodiments of the constructs and methods can produce improved expression of protein products secreted against multimeric proteins, particularly including antibodies.

시그날Signal 펩타이드Peptide  And 시그날Signal 펩티다제Peptidase

단백질이 막에 대한 단백질 표적화에 대해 이들의 아미노산 서열내 정보를 함유하는 시그날 가설은 30년 이상 동안 알려져왔다. 밀슈타인(Milstein)과 공동-연구자들은, 흑색종 세포로부터 IgG의 경쇄가 고 분자량 형태로 합성되어 세포질세망 소낭(미세소체)가 해독 시스템에 가해지는 경우 이의 성숙한 형태로 전환되었음을 발견하였고, 미세소체가 전구체 단백질 형태를 아미노-말단 연장 펩타이드를 제거함으로써 성숙한 형태로 전환시키는 프로테아제를 함유하는 당해 결과를 기초로 하는 모델을 제안하였다. 시그날 가설은 곧 미토콘드리아 및 엽록체와 같은 상이한 세포내 막에 국재화된 단백질내 명백한 표적화 시그날을 함유하도록 확장되었다. 이들 명백한 표적화 서열은 특이적인 시그날 펩티다제(SPase)에 의해 유출된 단백질로부터 절단됨이 후에 밝혀졌다.Signal hypotheses in which proteins contain information in their amino acid sequence for protein targeting to the membrane have been known for more than 30 years. Milstein and co-researchers found that the light chain of IgG from melanoma cells was synthesized in high molecular weight form and converted to its mature form when cytoplasmic reticulum vesicles (microsomal bodies) were added to the detoxification system. A model based on these results containing a protease that converts the precursor protein form to mature form by removing the amino-terminal extension peptide was proposed. The signal hypothesis soon expanded to contain distinct targeting signals in proteins localized to different intracellular membranes such as mitochondria and chloroplasts. These apparent targeting sequences were later found to be cleaved from the protein exported by specific signal peptidase (SPase).

세균에서 시그날 펩타이드를 절단시키는데 관여하는 적어도 3개의 명백한 SPase가 존재한다. SPase I은 SecYEG 경로 또는 트윈 아르기닌 전좌(Tat) 경로에 의해 유출된 비지단백질 기질을 프로세싱할 수 있다. Sec 경로에 의해 유출된 지단백질은 SPase II에 의해 절단된다. SPase IV는 제IV형 프레필린 및 제II형 분비 장치의 성분인 프레필린-유사 단백질을 절단시킨다.There are at least three distinct SPases involved in cleaving signal peptides in bacteria. SPase I can process non-lipoprotein substrates exported by the SecYEG pathway or the twin arginine translocation (Tat) pathway. Lipoproteins released by the Sec pathway are cleaved by SPase II. SPase IV cleaves prepilin-like proteins that are components of type IV prepilins and type II secretion devices.

진핵세포에서, 세망세포질(ER) 막에 대해 표적화된 단백질은 Sec61 전좌 기구에 대해 동시해독적으로 또는 후-해독적으로 단백질을 표적화하는 시그날 펩타이드에 의해 매개된다. ER 시그날 펩타이드는 이들의 세균 대응물의 것과 유사한 특징을 갖는다. ER 시그날 펩타이드는 시그날 펩티다제 복합체(SPC)에 의해 ER 관강(lumen)내로 유출된 후 유출된 단백질로부터 절단된다.In eukaryotic cells, proteins targeted to reticulum (ER) membranes are mediated by signal peptides that target proteins either co-detoxically or post-detoxically against the Sec61 translocation machinery. ER signal peptides have characteristics similar to those of their bacterial counterparts. The ER signal peptide is cleaved from the outflowed protein after it is flowed into the ER lumen by the signal peptidase complex (SPC).

진핵 세포내에서 상이한 위치로 단백질을 분류하는 시그날 펩타이드는, 이들 세포가 많은 상이한 막과 수성 구획을 함유하므로 구별되어야 한다. ER로 표적화되는 단백질은 종종 절단가능한 시그날 서열을 함유한다. 놀랍게도, 많은 인공 펩타이드는 전좌 시그날로서 기능할 수 있다. 가장 중요한 주요 특징은 상기 특정의 한계를 초과하는 소수성인 것으로 여겨진다. ER 시그날 펩타이드는 세균 시그날 펩타이드보다 더 많은 함량의 류신 잔기를 가진다. 시그날 인식 입자(SRP)는, 절단가능한 시그날 펩타이드가 리보솜으로부터 생성된 후 이들에 결합한다. SRP는 ER 막에 대해 인접한 단백질을 표적화하는데 요구된다. ER 관강으로 단백질의 전좌 후, 유출된 단백질은 SPC에 의해 프로세싱된다. 다른 양태는 진핵 세포내에서 천연적으로 발생하는 시그날(리더) 펩타이드 프로세싱 효소의 장점을 취한다.Signal peptides that classify proteins at different positions in eukaryotic cells should be distinguished because these cells contain many different membranes and aqueous compartments. Proteins targeted to ER often contain cleavable signal sequences. Surprisingly, many artificial peptides can function as translocation signals. The most important key feature is believed to be hydrophobicity exceeding this particular limit. ER signal peptides have a higher content of leucine residues than bacterial signal peptides. Signal recognition particles (SRP) bind to cleavable signal peptides after they are generated from ribosomes. SRP is required to target adjacent proteins against the ER membrane. After translocation of the protein into the ER lumen, the spilled protein is processed by SPC. Another embodiment takes advantage of signal (leader) peptide processing enzymes occurring naturally in eukaryotic cells.

대부분의 공지된 ER 시그날 펩타이드는 N-말단 절단가능하거나 내부적으로 절단가능하지 않다. 최근에, C형 간염 바이러스, 한타바이러스(hantavirus), 플라비바이러스(flavivirus), 루벨라 바이러스(rubella virus) 및 인플루엔자 C형 바이러스내에서 발견된 것들과 같은 다수의 바이러스 폴리프로테인은 ER SPC에 의해 가장 흔히 절단되는 내부 시그날 펩타이드를 함유하는 것으로 밝혀졌다. 폴리프로테인의 성숙에 있어서 이들 연구는, SPC가 아미노-말단적으로 위치한 시그날 펩타이드 뿐만 아니라, 내부 시그날 펩타이드 후에도 절단할 수 있음을 나타낸다. 따라서, 예측된 시그날 펩티다제 기질 특이성 성분의 돌연변이유발은 바이러스 감염성을 차단할 수 있다.Most known ER signal peptides are either N-terminal cleavable or not internally cleavable. Recently, many viral polyproteins, such as those found in hepatitis C virus, hantavirus, flavivirus, rubella virus, and influenza C virus, have been identified by ER SPC. It has been found to contain internal signal peptides that are most frequently cleaved. These studies in the maturation of polyproteins indicate that SPC can cleave not only after amino-terminal located signal peptides but also after internal signal peptides. Thus, mutagenesis of the predicted signal peptidase substrate specific components can block viral infectivity.

프레세닐린-유형 아스파르틱 프로테아제 시그날 펩타이드 펩티다제(SPP)는 이들의 막관통 영역내에서 시그날 펩타이드를 절단한다. SPP는 사람에서 시그날 펩타이드-기원한 HLA-E 에피토프의 생성에 필수적이다.Presenilin-type aspartic protease signal peptide peptidase (SPP) cleaves signal peptides within their transmembrane region. SPP is essential for the generation of signal peptide-derived HLA-E epitopes in humans.

시그날 펩티다제는 당해 분야에 잘 공지되어 있다[참조: 예를 들면, Paetzel M. 2002. Chem. Rev. 102(12): 4549; Pekosz A. 1998. Proc. Natl. Acad. Sci. USA. 95:13233-13238; Marius K. 2002. Molecular Cell 10:735-744; Okamoto K. 2004. J. Virol. 78:6370-6380, Vol. 78; Martoglio B. 2003. Human Molecular Genetics 12: R201 -R206; 및 Xia W. 2003. J. Cell Sci. 116:2839-2844].Signal peptidase is well known in the art. See, eg, Paetzel M. 2002. Chem. Rev. 102 (12): 4549; Pekosz A. 1998. Proc. Natl. Acad. Sci. USA. 95: 13233-13238; Marius K. 2002. Molecular Cell 10: 735-744; Okamoto K. 2004. J. Virol. 78: 6370-6380, Vol. 78; Martoglio B. 2003. Human Molecular Genetics 12: R201-R206; And Xia W. 2003. J. Cell Sci. 116: 2839-2844.

본 발명의 양태들은 단일 전사체에서 폴리펩타이드의 발현을 위한 내부 절단가능한 시그날 펩타이드를 사용한다. 단일의 전사된 폴리펩타이드는 이후에 SPC에 의해 절단되어, 개개 펩타이드를 별도로 남게 하거나 개개의 펩타이드를 단백질로 조립시킨다. 본 발명의 방법은 단일의 전사된 폴리펩타이드내에서 면역글로불린 중쇄 및 경쇄의 발현에 적용가능하며, 절단 후 성숙한 면역글로불린으로 조립된다. 당해 기술은 폴리펩타이드 사이토킨, 성장 인자, 또는 다양한 다른 단백질, 예를 들면, 단일의 전사된 폴리펩타이드내 IL-12p40 및 IL-12p35에 적용가능하며, 이후에 IL-12, 또는 단일의 전사된 폴리펩타이드내에서 IL-12p40 및 IL-23p19로 조립된 후 IL-23으로 조립된다.Embodiments of the invention use an internal cleavable signal peptide for expression of a polypeptide in a single transcript. The single transcribed polypeptide is then cleaved by SPC, leaving the individual peptides separate or assembling the individual peptides into proteins. The method of the present invention is applicable to the expression of immunoglobulin heavy and light chains in a single transcribed polypeptide and is assembled into mature immunoglobulins after cleavage. The technique is applicable to polypeptides cytokines, growth factors, or various other proteins such as IL-12p40 and IL-12p35 in a single transcribed polypeptide, followed by IL-12, or a single transcribed poly. Assembled with IL-12p40 and IL-23p19 in the peptide and then with IL-23.

시그날 펩티다제 시도는 전구체 또는 폴리프로테인로부터 기능성 항체 또는 다른 프로세싱된 생성물의 발현을 생성하는 포유동물 발현 벡터에 적용가능하다. 항체의 경우에, 이는 내부 절단가능한 시그날 펩타이드인 중쇄와 경쇄 사이의 개재 서열(intervening sequence)과 함께 중쇄 및 경쇄 둘다를 함유한 폴리프로테인로서 벡터로부터 생산된다. 당해 내부 절단가능한 시그날 펩타이드는 ER-잔류 프로테아제, 주로 시그날 펩티다제, 프레세닐린 또는 프레세닐린-유사 프로테아제에 의해 절단되어, 중쇄와 경쇄가 남아서 폴딩되어 조립됨으로써 기능성 분자를 생성할 수 있고, 바람직하게는 이것은 분비된다. C형 간염 바이러스로부터 기원한 내부 절단가능한 시그날 펩타이드 외에, ER-잔류 프로테아제에 의해 절단될 수 있는 다른 내부 절단가능한 서열도 치환될 수 있다. 유사하게, 본 발명의 실시는, 시그날 펩티다제가 절단에 영향을 미치는 숙주 세포에 한정될 필요가 없으며, 또한 프레세닐린, 프레세닐린-유사 프로테아제, 및 폴리펩타이드를 프로세싱하기 위한 다른 프로테아제를 포함하나, 이에 한정되지 않는 프로테아제를 포함한다. 이들 프로테아제는 다른 것들 중에서 인용된 문헌에서 고찰되어 왔다.Signal peptidase trials are applicable to mammalian expression vectors that produce expression of functional antibodies or other processed products from precursors or polyproteins. In the case of an antibody, it is produced from a vector as a polyprotein containing both heavy and light chains with an intervening sequence between the heavy and light chains, an internal cleavable signal peptide. The internally cleavable signal peptide can be cleaved by an ER-residue protease, mainly a signal peptidase, a presenilin or a presenilin-like protease, leaving the heavy and light chains folded and assembled to produce a functional molecule, Preferably it is secreted. In addition to internal cleavable signal peptides derived from hepatitis C virus, other internal cleavable sequences that can be cleaved by the ER-residue protease can also be substituted. Similarly, the practice of the present invention need not be limited to host cells where the signal peptidase affects cleavage, but also includes presenilins, presenilin-like proteases, and other proteases for processing polypeptides. One includes, but is not limited to, proteases. These proteases have been considered in the cited literature among others.

또한, 본 발명은 면역글로불린 중쇄 및 경쇄의 발현에 한정되지 않으나, 이는 또한 단일 전사체로 발현된 후 내부 시그날 펩타이드 절단에 의해 각각의 개개 펩타이드 또는 단백질을 방출하는 다른 폴리펩타이드 및 폴리프로테인을 포함한다. 이들 단백질은 성숙한 생성물에서 함께 조립될 수 있거나 조립될 수 없다.In addition, the present invention is not limited to the expression of immunoglobulin heavy and light chains, but it also includes other polypeptides and polyproteins that are expressed as single transcripts and then release each individual peptide or protein by internal signal peptide cleavage. These proteins may or may not be assembled together in mature products.

또한, 개개의 폴리펩타이드가 대안의 순서, 즉, "펩타이드 1-내부 절단가능한 시그날 펩타이드-펩타이드 2" 또는 "펩타이드 2-내부 절단가능한 시그날 펩타이드-펩타이드 1"으로 존재하는 발현 작제물이다. 본 발명은 또한 "펩타이드 1-내부 절단가능한 시그날 펩타이드-펩타이드 2-내부 절단가능한 시그날 펩타이드-펩타이드 3" 등과 같은 내부 절단가능한 시그날 펩타이드에 의해 연결된 2개 이상의 펩타이드의 발현을 포함한다.In addition, the individual polypeptides are expression constructs present in an alternative sequence, ie, "peptide 1 -internally cleavable signal peptide-peptide 2" or "peptide 2-inner cleavable signal peptide-peptide 1". The invention also encompasses the expression of two or more peptides linked by an internal cleavable signal peptide such as “peptide 1-internal cleavable signal peptide-peptide 2-internal cleavable signal peptide-peptide 3” and the like.

또한, 본 발명은 제I 형 및 제II 형 막통과 단백질 둘 다의 발현 및 발현 작제물과 관련하여 다른 프로테아제 절단 부위에 적용된다.The invention also applies to other protease cleavage sites in connection with expression and expression constructs of both type I and type II transmembrane proteins.

본 발명은 또한 단일 전사체내에서 암호화된 폴리프로테인내 하나 이상의 폴리펩타이드의 성숙을 위한 내부 절단가능한 시그날 펩타이드를 사용할 수 있다. 이후에, 단일의 전사된 폴리펩타이드는 SPC에 의해 절단되어 별도의 개개 펩타이드 또는 단백질로 조립되는 개개의 펩타이드가 남는다. 본 발명의 양태들은 궁극적으로 성숙한 면역글로불린으로의 조립과 함께 단일의 전사된 폴리펩타이드내에 면역글로불린 중쇄 및 경쇄를 발현시키기 위한 조성물 및 방법을 포함한다. 본 발명은 폴리펩타이드 사이토킨, 성장 인자, 또는 각종의 다른 단백질을 발현시키기 위해, 예를 들면, 단일의 전사된 폴리펩타이드내에서 IL-12p40 및 IL-12p35를 발현시킨 후 IL-12, 또는 단일의 전사된 폴리펩타이드내 IL-12p40 및 IL-23p19로 조립시킨 후 IL-23으로 조립시키기 위해 적용가능하다.The invention may also use internal cleavable signal peptides for maturation of one or more polypeptides in a polyprotein encoded within a single transcript. Thereafter, the single transcribed polypeptide is cleaved by SPC, leaving individual peptides assembled into separate individual peptides or proteins. Aspects of the present invention include compositions and methods for expressing immunoglobulin heavy and light chains in a single transcribed polypeptide, ultimately with assembly into mature immunoglobulins. The present invention provides for the expression of a polypeptide cytokine, growth factor, or a variety of other proteins, for example, IL-12p40 and IL-12p35 in a single transcribed polypeptide, followed by IL-12, or a single Applicable for assembly with IL-12p40 and IL-23p19 in the transcribed polypeptide followed by assembly with IL-23.

시그날 펩타이드의 변형Modification of Signal Peptides

sORF 작제물의 양태에서, 변형된 시그날 펩타이드가 사용된다. 예를 들면, 중쇄-int-경쇄의 작제에 있어서, 항체 분비 농도는, 경쇄 시그날 펩타이드 서열의 소수성이 부위-지시된 돌연변이유발을 통해 감소된 경우 약 10배 증가되었다. 시그날 펩타이드는 2007년 3월 22일 카슨(Carson) 등에 의해 미국 특허 출원 공보 제US 20070065912호에 기술된 바와 같이 사용될 수 있다.In an embodiment of the sORF construct, a modified signal peptide is used. For example, for the construction of heavy-int-light chains, antibody secretion concentrations increased about 10-fold when the hydrophobicity of the light chain signal peptide sequences was reduced through site-directed mutagenesis. The signal peptide can be used as described in US Patent Application Publication No. US 20070065912, issued March 22, 2007 to Carson et al.

태그tag

본 발명의 sORF 작제물 설계의 양태는 태그, 바람직하게는 내부 태그를 함유하는 변형된 인테인의 용도를 포함한다. 각종의 태그가 당해 분야에 공지되어 있다. 본 발명의 태그들은 형광성 태그 및 화학발광성 태그를 포함하나, 이에 한정되지 않는다. 이러한 작제물을 사용하여, 발현된 폴리프로테인의 양을 개개의 세포내에서 형광성 검출을 사용하여 모니터링할 수 있다. 또한, 이들 세포는 형광성 활성화된 세포 분류(FACS)를 사용하여 단백질 발현 수준에 따라 분류할 수 있다. 이러한 태그의 용도는, 이것이 FACS 분석을 통해 고 생산 세포 또는 세포주의 선택을 가능하도록 하므로 안정한 세포주 생성에 있어 특히 유용하다. 본 발명에 교시된 바와 같이, 완전한 길이의 인테인은 플랭킹 항체 중쇄 및 경쇄로부터 이들의 자가-절단 후 세포 분해물 속에서 관측되어 왔다. 이는 형광성 표지된 인테인의 검출 및 안정한 세포주 생성에 있어서 이들의 용도를 위한 염기들을 제공한다. 태그는 또한 단백질의 정제시 사용될 수 있다.Aspects of the sORF construct design of the present invention include the use of modified inteins containing a tag, preferably an inner tag. Various tags are known in the art. Tags of the present invention include, but are not limited to, fluorescent tags and chemiluminescent tags. Using this construct, the amount of polyprotein expressed can be monitored using fluorescence detection in individual cells. In addition, these cells can be sorted according to protein expression levels using fluorescent activated cell sorting (FACS). The use of such a tag is particularly useful for the production of stable cell lines since it allows the selection of high producing cells or cell lines via FACS analysis. As taught herein, full length inteins have been observed in cell lysates after their self-cleavage from flanking antibody heavy and light chains. This provides bases for the detection of fluorescently labeled intaines and their use in the production of stable cell lines. The tag can also be used in the purification of proteins.

미니-mini- 인테인Intaine

피. 호리코시이 PolI 인테인 및 Sce. VMA 인테인을 포함하는 많은 인테인에 존재하는 엔도뉴클레아제 영역이 유전자 발현 시스템의 경우 특히 유리하지 않기 때문에, 엔도뉴클레아제 도메인은 임의로 결실되어 소 링커로 교체됨으로써 "미니-인테인"을 생성할 수 있다. 이들 가공된 미니-인테인은 또한 기술된 작제물 설계에 유용하며, 이들은, 인테인 암호화 영역이 현저히 작아서, 목적한 폴리펩타이드를 암호화하는 보다 큰 서열을 허용하고/하거나 재조합체 DNA 분자의 보다 큰 취급 용이성을 허용하는 장점을 제공한다.blood. Horikosii PolI Intein and Sce. Because the endonuclease regions present in many inteins, including the VMA intein, are not particularly advantageous in the case of gene expression systems, the endonuclease domains are optionally deleted and replaced with bovine linkers to replace the "mini-inteins". Can be generated. These engineered mini-intaines are also useful for designing the described constructs, which have significantly smaller intein coding regions, allowing for larger sequences encoding the desired polypeptide and / or larger size of recombinant DNA molecules. It offers the advantage of allowing ease of handling.

양태들에서, 완전한 사람 특성을 갖는 항체 또는 이의 유사체를 사용하는 것이 유리하다. 이들 시약은 비-사람 종으로부터 기원하는 항체 또는 유사체에 의해 유도된 바람직하지 않은 면역 반응을 피한다. 자가-프로세싱되는 펩타이드로부터 기원한 아미노산 잔기에 가능한 숙주 면역 반응에 초점을 맞추기 위해, 단백질분해 절단 부위에 대한 암호화 서열을 제1 단백질에 대한 암호화 서열과 자가-프로세싱되는 펩타이드에 대한 암호화 서열 사이에 삽입(당해 분야에 공지된 표준 방법론을 사용하여)삽입시켜 발현된 폴리펩타이드, 즉, 항체로부터 자가-프로세싱 펩타이드 서열을 제거할 수 있다. 이는 생체내에서 사용하기 위한 치료용 또는 진단용 항체에 있어 특별한 유용성을 발견한다.In embodiments, it is advantageous to use an antibody or analog thereof having complete human properties. These reagents avoid undesirable immune responses induced by antibodies or analogs derived from non-human species. To focus on possible host immune responses to amino acid residues derived from self-processed peptides, the coding sequence for the proteolytic cleavage site is inserted between the coding sequence for the first protein and the coding sequence for the self-processed peptide. Insertion (using standard methodologies known in the art) can be inserted to remove self-processing peptide sequences from expressed polypeptides, ie antibodies. This finds particular utility in therapeutic or diagnostic antibodies for use in vivo.

유전자 전달 및 바이러스 벡터를 포함하는 벡터Vectors containing gene transfer and viral vectors

본 발명은 2개 이상의 폴리펩타이드 또는 단백질에 대한 암호화 서열 및 세포내로 자가 프로세싱되는 절단 서열을 포함하는 작제물의 도입을 위한 각종 벡터들 중 어느 것의 사용을 고려한다. 유전자 발현 벡터의 다수의 예가 당해 분야에 공지되어 있으며 바이러스 또는 비-바이러스 기원일 수 있다. 본 발명의 실시에서 사용될 수 있는 비-바이러스 유전자 전달 방법은 플라스미드, 리포솜, 핵산/리포솜 복합체, 양이온성 지질 등을 포함하나, 이에 한정되지 않는다.The present invention contemplates the use of any of a variety of vectors for the introduction of constructs comprising coding sequences for two or more polypeptides or proteins and cleavage sequences that are self processed into cells. Many examples of gene expression vectors are known in the art and may be of viral or non-viral origin. Non-viral gene delivery methods that can be used in the practice of the present invention include, but are not limited to, plasmids, liposomes, nucleic acid / liposomal complexes, cationic lipids, and the like.

바이러스 및 다른 벡터는 세포를 효율적으로 형질도입하여 이들 자체의 DNA를 숙주 세포내로 도입시킬 수 있다. 재조합체 바이러스 벡터를 생성하는데 있어서, 비-필수적인 유전자를 목적한 단백질 또는 폴리펩타이드를 암호화하는 발현가능한 서열로 교체한다. 예시적인 벡터는 바이러스 및 비-바이러스 벡터, 예를 들면, 레트로바이러스 벡터(렌티바이러스 벡터 포함), 복제 상보체, 복제 결여 및 이의 무기력한 형태(gutless form)를 포함하는 아데노바이러스(Ad) 벡터, 아데노-관련 바이러스(AAV) 벡터, 시미안 바이러스 40(SV-40) 벡터, 소 파필로마 벡터, 엡슈타인-바르(Epstein-Barr) 벡터, 헤르페스 벡터, 박시니아 벡터, 몰로니 뮤린 백혈병 벡터, 하비 뮤린(Harvey murine) 육종 바이러스 벡터, 뮤린 유방 종양 바이러스 벡터, 라우스 육종(Rous sarcoma) 바이러스 벡터 및 비바이러스 플라스미드를 포함하나, 이에 한정되지 않는다. 바쿨로바이러스 벡터는 잘 공지되어 있으며 곤충 세포내에서 발현시키기에 적합하다. 포유동물 또는 다른 진핵 세포내에서 발현에 적합한 다수의 벡터는 당해 분야에 잘 공지되어 있으며, 많은 것이 시판되고 있다. 시판되는 공급원은, 스트라타젠(Stratagene, 캘리포니아주 라 졸라 소재); 인비트로겐(Invitrogen, 캘리포니아주 칼스바드 소재); 프로메가(Promega, 위스콘신주 매디슨 소재) 및 시그마-알드리치(Sigma-Aldrich, 미주리주 세인트 루이스 소재)를 포함하나, 이에 한정되지 않는다. 많은 벡터 서열이 진뱅크(GenBank)를 통해 사용가능하며, 벡터에 관한 추가의 정보는 라이켄 바이오소스 센서(Riken BioSource Center)를 통한 인터넷 상에서 사용가능하다.Viruses and other vectors can efficiently transduce cells and introduce their own DNA into host cells. In generating recombinant viral vectors, non-essential genes are replaced with expressible sequences encoding the protein or polypeptide of interest. Exemplary vectors include viral and non-viral vectors, such as adenovirus (Ad) vectors, including retroviral vectors (including lentiviral vectors), replication complements, lack of replication, and gutless forms, Adeno-associated virus (AAV) vector, Simian virus 40 (SV-40) vector, bovine papilloma vector, Epstein-Barr vector, herpes vector, bacsinia vector, molony murine leukemia vector, harvey Harvey murine sarcoma virus vectors, murine breast tumor virus vectors, Rous sarcoma virus vectors, and non-viral plasmids. Baculovirus vectors are well known and suitable for expression in insect cells. Many vectors suitable for expression in mammalian or other eukaryotic cells are well known in the art and many are commercially available. Commercially available sources include Stratagene (La Jolla, Calif.); Invitrogen (Carlsbad, CA); Promega (Madison, WI) and Sigma-Aldrich (St. Louis, MO). Many vector sequences are available through GenBank, and additional information about the vector is available on the Internet through the Riken BioSource Center.

하나의 양태에서, 벡터는 통상적으로 복제 오리진을 포함하며 벡터는 또한, 이에 의해 벡터가 확인되어 선택될 수 있는 "마커" 또는 "선택가능한 마커" 기능을 포함하거나 포함하지 않을 수 있다. 어떠한 선택가능한 마커도 사용가능하지만, 재조합체 벡터에서 사용하기 위한 선택가능한 마커는 일반적으로 당해 분야에 공지되어 있고, 적절한 선택가능한 마커의 선택은 숙주 세포에 의존할 것이다. 항생제 또는 다른 독소에 대해 내성을 부여하는 단백질을 암호화하는 선택가능한 마커 유전자의 예는 암피실린, 메토트렉세이트, 테트라사이클린, 네오마이신(참조: Southern et al. 1982. J Mol Appl Genet. 1:327-41), 마이코페놀산(참조: Mulligan et al. 1980. Science 209:1422-7), 푸로마이신, 제오마이신, 하이그로마이신(참조: Sugden et al. 1985. Mol Cell Biol. 5:410-3), 디하이드로폴레이트 리덕타제, 글루타민 합성효소 및 G418을 포함하나, 이에 한정되지 않는다. 당해 분야의 숙련가에게 이해될 바와 같이, 발현 벡터는 통상적으로 발현될 암호화 서열(들)에 적절한 것으로서, 복제 오리진, 발현될 암호화 서열 또는 서열들에 작동적으로 연결된 프로모터, 및 리보솜 결합 부위, RNA 스플라이싱 부위, 폴리아데닐화 부위, 및 전사 종결인자 서열을 포함한다.In one aspect, the vector typically comprises a replication origin and the vector may or may not also include a "marker" or "selectable marker" function by which the vector can be identified and selected. While any selectable marker can be used, selectable markers for use in recombinant vectors are generally known in the art and the selection of the appropriate selectable marker will depend on the host cell. Examples of selectable marker genes that encode proteins that confer resistance to antibiotics or other toxins are ampicillin, methotrexate, tetracycline, neomycin (Southern et al. 1982. J Mol Appl Genet. 1: 327-41) , Mycophenolic acid (Mulligan et al. 1980. Science 209: 1422-7), puromycin, zeomycin, hygromycin (Sugden et al. 1985. Mol Cell Biol. 5: 410-3), Dihydrofolate reductase, glutamine synthetase, and G418. As will be appreciated by those skilled in the art, expression vectors are typically appropriate for the coding sequence (s) to be expressed, such as replication origin, promoter operably linked to the coding sequence or sequences to be expressed, and ribosomal binding sites, RNA stubs. Fliesing site, polyadenylation site, and transcription terminator sequence.

"재조합체"로서 벡터 또는 다른 DNA 서열에 대한 참조 문헌들은 단지 천연으로부터 분리되거나 발견된 것으로서 전형적으로 작동적으로 연결되지 않는 DNA 서열의 작동가능한 연결을 단순히 인지하고 있다. 조절성(발현 및/또는 제어) 서열은, 발현 및/또는 제어 서열이 전사를 조절하고, 경우에 따라 핵산 서열의 해독을 조절하는 경우 핵산 암호화 서열에 작동적으로 연결된다. 따라서, 발현 및/또는 제어 서열은 프로모터, 인핸서, 전사 종결인자, 암호화 서열에 대한 출발 코돈(즉, ATG) 5', 인트론에 대한 스플라이싱 시그날 및 정지 코돈을 포함할 수 있다.References to vectors or other DNA sequences as “recombinants” merely recognize operable linkage of DNA sequences that have been isolated or found from nature and are typically not operably linked. Regulatory (expression and / or control) sequences are operably linked to nucleic acid coding sequences when the expression and / or control sequences control transcription and, optionally, the translation of nucleic acid sequences. Thus, expression and / or control sequences may include promoters, enhancers, transcription terminators, start codons (ie ATG) 5 ′ for the coding sequence, splicing signals for introns, and stop codons.

아데노바이러스 유전자 치료요법 벡터는 강력한 일시적인 발현, 탁월한 역가, 및 생체내에서 분열하는 세포 및 분열하지 않는 세포를 형질도입하는 능력을 나타내는 것으로 알려져 있다(참조: Hitt et al. 2000. Adv in Virus Res 55:479-505). 재조합체 Ad 벡터는, 벡터가 복제-결여성 Ad 비리온내로 도입되도록 할 수 있는 패키징 부위(packaging site); 목적한 2개 이상의 폴리펩타이드 또는 단백질에 대한 암호화 서열, 예를 들면, 목적한 면역글로불린의 중쇄 및 경쇄; 및 단독으로나 추가의 단백질분해 절단 부위와 함께 자가-프로세싱되는 절단 부위를 암호화하는 서열을 포함할 수 있다. 감염성 비리온내로 도입하는데 필수적이거나 도움이 되는 다른 성분들은 5' 및 3' Ad ITR, E2 유전자, E4 유전자의 부위 및 임의로 E3 유전자를 포함한다.Adenovirus gene therapy vectors are known to exhibit strong transient expression, excellent titers, and the ability to transduce dividing and non-dividing cells in vivo (Hitt et al. 2000. Adv in Virus Res 55). 479-505). Recombinant Ad vectors include a packaging site capable of introducing the vector into a replication-deficient Ad virion; Coding sequences for two or more polypeptides or proteins of interest, such as the heavy and light chains of an immunoglobulin of interest; And a sequence encoding a cleavage site that is self-processed alone or in combination with additional proteolytic cleavage sites. Other components essential or helpful for introduction into infectious virions include 5 'and 3' Ad ITRs, E2 genes, regions of E4 genes and optionally E3 genes.

재조합체 Ad 벡터를 봉입하는 복제-결여성 Ad 비리온은 당해 분야에 공지된 표준 기술에 의해 Ad 패키징 세포 및 패키징 기술을 사용하여 제조된다. 이들 방법의 예는 예를 들면, 미국 특허 제5,872,005호에서 찾을 수 있다. 2개 이상의 목적한 폴리펩타이드 또는 단백질에 대한 암호화 서열은 바이러스 게놈의 결실된 E3 영역내에서 아데노바이러스내로 일반적으로 삽입된다. 본 발명을 실시하는데 사용하기 위한 바람직한 아데노바이러스 벡터는 하나 이상의 야생형 Ad 유전자 생성물, 예를 들면, E1a, E1b, E2, E3, 및 E4를 발현하지 않는다. 바람직한 양태는 E1, E2A, E4 및 임의로 E3 유전자 영역의 기능을 보충하는 패키징 세포주와 함께 전형적으로 사용되는 비리온이다(참조: 예를 들면, 미국 특허 제5,872,005호, 제5,994,106호, 제6,133,028호 및 제6,127,175호).Replication-deficient Ad virions encapsulating recombinant Ad vectors are prepared using Ad packaging cells and packaging techniques by standard techniques known in the art. Examples of these methods can be found, for example, in US Pat. No. 5,872,005. Coding sequences for two or more desired polypeptides or proteins are generally inserted into the adenovirus within the deleted E3 region of the viral genome. Preferred adenovirus vectors for use in practicing the present invention do not express one or more wild type Ad gene products, such as E1a, E1b, E2, E3, and E4. Preferred embodiments are virions typically used with packaging cell lines that complement the functions of E1, E2A, E4 and optionally E3 gene regions (see, eg, US Pat. Nos. 5,872,005, 5,994,106, 6,133,028 and No. 6,127,175).

본원에 사용된 것으로서, "아데노바이러스" 및 "아데노바이러스 입자"는 바이러스 자체 또는 이의 유도체이며 달리 나타낸 것을 제외한, 모든 혈청형 및 아형, 및 천연적으로 존재하는 형태 및 재조합체 형태 둘다를 포함한다. 이러한 아데노바이러스는 야생형이거나 당해 분야에 공지되거나 본원에 토의된 바와 같은 각종 방식으로 변형시킬 수 있다. 이러한 변형은 감염성 바이러스를 제조하기 위하여 입자내로 패키징되는 아데노바이러스 게놈에 대한 변형을 포함한다. 이러한 변형은 하나 이상의 E1a, E1b, E2a, E2b, E3, 또는 E4 암호화 영역 중의 하나 이상과 같이, 당해 분야에 공지된 결실을 포함한다. 예시적인 패키징 및 생산자 세포는 293, A549 또는 HeLa 세포로부터 기원한다. 아데노바이러스 벡터는 당해 분야에 공지된 표준 기술을 사용하여 정제하고 제형화된다.As used herein, “adenovirus” and “adenovirus particles” include all serotypes and subtypes, and both naturally occurring and recombinant forms, except where otherwise indicated and are the virus itself or derivatives thereof. Such adenoviruses may be wild type or may be modified in various ways as known in the art or as discussed herein. Such modifications include modifications to the adenovirus genome that are packaged into particles to produce infectious viruses. Such modifications include deletions known in the art, such as one or more of one or more El, Elb, E2a, E2b, E3, or E4 coding regions. Exemplary packaging and producer cells are from 293, A549 or HeLa cells. Adenovirus vectors are purified and formulated using standard techniques known in the art.

아데노-관련 바이러스(AAV)는 염색체 통합에 의해 잠재적으로 세포를 감염시킬 수 있는 헬퍼-의존성 사람 파르보바이러스이다. 염색체적으로 통합되는 이의 능력 및 이의 비병원성 특성으로 인하여, AAV는 사람 유전자 치료요법 벡터로서 유의적으로 유효하다. 본 발명을 실시하는데 사용하기 위해, rAAV 비리온을 당해 분야의 숙련가에게 공지된 표준 방법론을 사용하여 생산할 수 있으며 이들은 전사 방향으로 작동적으로 연결된 성분으로서, 전사 개시 및 종결 서열, 및 목적한 암호화 서열(들)을 포함하는 제어 서열을 포함하도록 작제된다. 보다 구체적으로, 본 발명의 재조합체 AAV 벡터는, 벡터가 복제-결여성 AAV 비리온내로 혼입될 수 있도록 하는 패키징 부위; 목적한 2개 이상의 폴리펩타이드 또는 단백질에 대한 암호화 서열, 예를 들면, 목적한 면역글로불린의 중쇄 및 경쇄; 단독 또는 하나 이상의 추가의 단백질분해 절단 부위와 함께 자가-프로세싱되는 절단 부위를 암호화하는 서열을 포함한다. 본 발명을 실시하는데 사용하기 위한 AAV 벡터는, 이들이 또한 전사 방향으로 작동적으로 연결된 성분으로서 전사 개시 및 종결 서열을 포함하는 제어 서열을 포함한다. 이들 성분들은 기능성 AAV ITR 서열에 의해 5' 및 3' 말단에서 플랭킹된다. "기능성 AAV ITR 서열"은, ITR 서열이 AAV 비리온의 구조(rescue), 복제 및 패키징을 위해 의도되는 바와 같이 기능함을 의미한다.Adeno-associated virus (AAV) is a helper-dependent human parvovirus that can potentially infect cells by chromosomal integration. Because of its ability to integrate chromosomes and its nonpathogenic nature, AAV is significantly effective as a human gene therapy vector. For use in practicing the present invention, rAAV virions can be produced using standard methodologies known to those skilled in the art, which are components that are operably linked in the transcription direction, including transcription initiation and termination sequences, and desired coding sequences. It is constructed to include a control sequence comprising the (s). More specifically, the recombinant AAV vectors of the present invention may comprise a packaging site that allows the vector to be incorporated into a replication-deficient AAV virion; Coding sequences for two or more polypeptides or proteins of interest, such as the heavy and light chains of an immunoglobulin of interest; A sequence encoding a cleavage site that is self-processed alone or in combination with one or more additional proteolytic cleavage sites. AAV vectors for use in practicing the present invention include control sequences comprising transcription initiation and termination sequences as components in which they are also operably linked in the transcription direction. These components are flanked at the 5 'and 3' ends by functional AAV ITR sequences. By "functional AAV ITR sequence" is meant that the ITR sequence functions as intended for the rescue, replication, and packaging of AAV virions.

재조합체 AAV 벡터는 또한, 이들이 표적 세포내에서 선택된 재조합체 폴리펩타이드 또는 단백질 생성물의 발현 및 생산을 지시할 수 있다는 점을 특징으로 한다. 따라서, 재조합체 벡터는 캡시드화(encapsidation)에 필수적인 AAV의 서열 및 재조합체 AAV(rAAV) 비리온의 감염을 위한 물리적인 구조 중 적어도 모두를 포함한다. 따라서, 발현 벡터에서 사용하기 위한 AAV ITR은 야생형 뉴클레오타이드 서열을 가질 필요가 없으며(참조: 예를 들면, Kotin. 1994. Hum. Gene Ther. 5:793-801), 뉴클레오타이드의 삽입, 결실 또는 치환에 의해 변경될 수 있거나 AAV ITR은 몇가지 AAV 혈청형 중 어느 것으로부터 기원할 수 있다. 일반적으로, AAV 벡터는 당해 분야에 공지된 아데노-관련 바이러스 혈청형으로부터 기원한 어떠한 벡터일 수 있다.Recombinant AAV vectors are also characterized in that they can direct the expression and production of selected recombinant polypeptides or protein products in target cells. Thus, the recombinant vector comprises at least both the sequence of AAV essential for encapsidation and the physical structure for infection of the recombinant AAV (rAAV) virion. Thus, AAV ITRs for use in expression vectors need not have a wild type nucleotide sequence (see, eg, Kotin. 1994. Hum. Gene Ther. 5: 793-801), and are not required for insertion, deletion or substitution of nucleotides. Or AAV ITRs may originate from any of several AAV serotypes. In general, the AAV vector can be any vector derived from adeno-associated virus serotypes known in the art.

전형적으로, AAV 발현 벡터는 생산자 세포내로 도입된 후 AAV 헬퍼 작제물이 도입되며, 여기서, 헬퍼 작제물은 생산자 세포내에서 발현될 수 있고 AAV 벡터내에 부재하는 AAV 헬퍼 기능을 보충하는 AAV 암호화 영역을 포함한다. 헬퍼 작제물은 본원에 참조로 인용된 미국 특허 제6,548,286호에 기술된 바와 같이 전형적으로 ATG로부터 ACG로 p5를 수반한 출발 코돈을 돌연변이시킴에 의해, 거대한 Rep 단백질(Rep78 및 Rep68)의 발현을 하향 조절하도록 설계될 수 있다. 이는 헬퍼 바이러스 및/또는 추가의 벡터의 생산자 세포로의 도입을 수반하며, 여기서, 헬퍼 바이러스 및/또는 추가의 벡터는 효율적인 rAAV 바이러스 생산을 지지할 수 있는 보조 기능을 제공한다. 이후에, 생산자 세포를 배양하여 rAAV를 생산한다. 이들 단계는 표준 방법론으로 수행한다. 본 발명의 재조합체 AAV 벡터를 봉입할 수 있는 복제-결여성 AAV 비리온은 당해 분야에 공지된 표준 기술에 의해 AAV 패키징 세포 및 패키징 기술을 사용하여 제조한다. 이들 방법의 예는 본원에 이의 전문이 참조로 인용된 미국 특허 제5,436,146호; 제5,753,500호, 제6,040,183호, 제6,093,570호 및 제6,548,286호에서 찾을 수 있다. 패키징을 위한 추가의 조성물 및 방법은 또한 본원에 이의 전문이 참조로 인용된 왕(Wang) 등의 미국 특허 공보 제2002/0168342호에 기술되어 있으며, 당해 분야의 숙련가의 지식내에 있는 기술들을 포함한다.Typically, an AAV expression vector is introduced into a producer cell, followed by the introduction of an AAV helper construct, wherein the helper construct is provided with an AAV coding region that can be expressed in the producer cell and complements the AAV helper function absent in the AAV vector. Include. Helper constructs down-regulate the expression of the huge Rep proteins (Rep78 and Rep68) by mutating the start codon with p5, typically from ATG to ACG, as described in US Pat. No. 6,548,286, which is incorporated herein by reference. It can be designed to adjust. This involves the introduction of helper viruses and / or additional vectors into the producer cells, where the helper viruses and / or additional vectors provide an auxiliary function that can support efficient rAAV virus production. Thereafter, producer cells are cultured to produce rAAV. These steps are performed by standard methodology. Replication-deficient AAV virions capable of encapsulating recombinant AAV vectors of the invention are prepared using AAV packaging cells and packaging techniques by standard techniques known in the art. Examples of these methods are described in U. S. Patents 5,436, 146, which is incorporated by reference in its entirety; 5,753,500, 6,040,183, 6,093,570 and 6,548,286. Additional compositions and methods for packaging are also described in US Pat. Pub. No. 2002/0168342 to Wang et al., Incorporated herein by reference in its entirety, and includes techniques that are within the knowledge of one of ordinary skill in the art. .

본 발명을 실시하는데 있어서, rAAV 또는 다른 벡터 발현 벡터 비리온을 생산하기 위한 숙주 세포는 포유동물 세포, 곤충 세포, 미생물 및 효모를 포함한다. 숙주 세포는 또한, AAV 벡터 게놈이 안정하게 유지되고 패키징되는 숙주 세포 또는 생산자 세포에서 AAV(또는 다른) rep 및 cap 유전자가 안정하게 유지되는 패키징 세포일 수 있다. 예시적인 패키징 및 생산자 세포는 293, A549 또는 HeLa 세포로부터 기원한다. AAV 벡터는 당해 분야에 공지된 표준 기술을 사용하여 정제하고 제형화된다. 추가의 적합한 숙주 세포(벡터에 의존)는 차이니즈 햄스터 난소(CHO) 세포, CHO 디하이드로폴레이트 리덕타제 결여성 변이체, 예를 들면, CHO DX B11 또는 CHO DG44 세포(참조: 예를 들면, Urlaub and Chasin. 1980. Proc. Natl. Acad. Sci. 77:4216-4220), PerC.6 세포(참조: Jones et al. 2003. Biotechnol. Prog. 19:163-168) 또는 Sp/20 마우스 흑색종 세포(참조: Coney et al. 1994. Cancer Res. 54:2448-2455)를 포함한다.In practicing the present invention, host cells for producing rAAV or other vector expression vector virions include mammalian cells, insect cells, microorganisms and yeast. The host cell may also be a packaging cell in which the AAV (or other) rep and cap genes remain stable in the host cell or producer cell in which the AAV vector genome is stably maintained and packaged. Exemplary packaging and producer cells are from 293, A549 or HeLa cells. AAV vectors are purified and formulated using standard techniques known in the art. Further suitable host cells (depending on the vector) are Chinese hamster ovary (CHO) cells, CHO dihydrofolate reductase deficient variants, such as CHO DX B11 or CHO DG44 cells (see, for example, Urlaub and Chasin. 1980. Proc. Natl. Acad. Sci. 77: 4216-4220), PerC.6 cells (Jones et al. 2003. Biotechnol. Prog. 19: 163-168) or Sp / 20 mouse melanoma cells (Coney et al. 1994. Cancer Res. 54: 2448-2455).

레트로바이러스 벡터Retrovirus vector

레트로바이러스 벡터는 유전자 전달을 위해 사용될 수 있다(참조: Miller. 1992. Nature 357: 455-460). 레트로바이러스 벡터 및 보다 특히 렌티바이러스 벡터는 본 발명을 실시하는데 사용될 수 있다. 따라서, 본원에 사용된 것으로서 용어 "레트로바이러스" 또는 "레트로바이러스 벡터"는 "렌티바이러스" 및 "렌티바이러스 벡터" 각각을 포함함을 의미한다. 레트로바이러스 벡터는 시험되어 광범위한 표적 세포의 게놈내로 목적한 유전자를 안정하게 도입시키기에 적합한 전달 비히클임이 밝혀졌다. 재정렬되지 않은 단일 카피의 이식유전자를 세포내로 전달하기 위한 레트로바이러스 벡터의 능력은, 레트로바이러스 벡터가 유전자를 세포내로 형질전달하기에 매우 적합하도록 한다. 또한, 레트로바이러스는 레트로바이러스 엔벨로프 당단백질의 숙주 세포상의 특이적인 세포 표면 수용체에 대한 결합에 의해 숙주 세포로 도입한다. 결과적으로, 암호화된 천연 엔벨로프 단백질이 천연 엔벨로프 단백질보다 상이한 세포 특이성을 갖는 이종 엔벨로프 단백질에 의해 교체되는(예를 들면, 천연의 엔벨로프 단백질과 비교하여 상이한 세포-표면 수용체에 결합하는) 슈도타입(pseudotyped) 레트로바이러스 벡터는 또한 본 발명을 실시하는데 있어서의 유용성을 찾을 수 있다. 하나 이상의 표적 단백질 암호화 서열을 암호화하는 레트로바이러스 벡터의 특이적인 표적 세포로의 전달을 지시하는 능력이 본 발명을 실시하는데 바람직하다.Retroviral vectors can be used for gene delivery (Miller. 1992. Nature 357: 455-460). Retroviral vectors and more particularly lentivirus vectors can be used to practice the present invention. Thus, as used herein, the term "retrovirus" or "retroviral vector" is meant to include "lentiviral" and "lentiviral vector" respectively. Retroviral vectors have been tested and found to be suitable delivery vehicles for stably introducing the desired gene into the genome of a wide range of target cells. The ability of retroviral vectors to deliver unrearranged single copies of transgenes into cells makes retroviral vectors well suited for transgene transfer of genes into cells. Retroviruses are also introduced into host cells by binding of the retrovirus envelope glycoproteins to specific cell surface receptors on the host cells. As a result, the pseudotyped natural envelope protein is replaced by a heterologous envelope protein that has a different cell specificity than the native envelope protein (eg, binds to a different cell-surface receptor as compared to the native envelope protein). Retroviral vectors may also find utility in practicing the present invention. The ability to direct the delivery of retroviral vectors that encode one or more target protein coding sequences to specific target cells is desirable in practicing the present invention.

본 발명은 예를 들면, 하나 이상의 이식유전자 서열을 포함하는 레트로바이러스 전달 벡터 및 하나 이상의 패키징 성분들을 포함하는 레트로바이러스 패키징 벡터를 포함하는 레트로바이러스 벡터를 제공한다. 특히, 본 발명은 슈도타입 레트로바이러스를 생산하기 위한 이종 또는 기능적으로 변형된 엔벨로프 단백질을 암호화하는 슈도타입 레트로바이러스 벡터를 제공한다.The present invention provides a retroviral vector comprising, for example, a retroviral delivery vector comprising one or more transgene sequences and a retroviral packaging vector comprising one or more packaging components. In particular, the present invention provides pseudotype retroviral vectors encoding heterologous or functionally modified envelope proteins for producing pseudotype retroviruses.

본 발명의 레트로바이러스 벡터의 코어 서열은 예를 들면, B, C, 및 D 유형 레트로바이러스를 포함하는 광범위한 레트로바이러스 및, 스푸마바이러스(spumavirus) 및 렌티바이러스로부터 용이하게 기원할 수 있다(참조: RNA Tumor Viruses, Second Edition, Cold Spring Harbor Laboratory, 1985). 본 발명의 조성물 및 방법에 사용하기에 적합한 레트로바이러스의 예는 렌티바이러스를 포함하나, 이에 한정되지 않는다. 본 발명의 조성물 및 방법에 사용하기에 적합한 다른 레트로바이러스는 조류 백혈증 바이러스(Avian Leukosis Virus), 소 백별병 바이러스(Bovine Leukemia Virus), 뮤린 백혈병 바이러스(Murine Leukemia Virus), 민크-세포 유도 바이러스(Mink-Cell Focus-Inducing Virus), 뮤린 육종 바이러스(Murine Sarcoma Virus), 그물내피증 바이러스(Reticuloendotheliosis virus) 및 라우스 육종 바이러스를 포함하나, 이에 한정되지 않는다. 특히 바람직한 뮤린 백혈병 바이러스는 4070A 및 1504A(참조: Hartley and Rowe. 1976. J. Virol. 19:19-25), 아벨슨(Abelson)(ATCC No. VR-999), 프렌드(Friend)(ATCC No. VR-245), 그라피(Graffi), 그로쓰(Gross)(ATCC No. VR-590), 키르슈타인 하르비 육종 바이러스(Kirsteni Harvey Sarcoma Virus) 및 라우셔(Rauscher)(ATCC No. VR-998), 및 몰로니 뮤린 육종 바이러스(Moloney Murine Leukemia Virus)(ATCC No. VR-190)를 포함한다. 이러한 레트로바이러스는 아메리칸 타입 컬쳐 컬렉션(ATCC; 버지니아주 마나사스 소재)과 같은 기탁기관 또는 수집기관으로부터 용이하게 입수할 수 있거나 상업적으로 사용가능한 기술을 사용하여 공지된 공급원으로부터 분리할 수 있다. 다른 것들은 상업적으로 사용가능하다.The core sequence of the retroviral vectors of the present invention can easily originate from a wide range of retroviruses including, for example, B, C, and D type retroviruses, and spumaviruses and lentiviruses. RNA Tumor Viruses, Second Edition, Cold Spring Harbor Laboratory, 1985). Examples of retroviruses suitable for use in the compositions and methods of the present invention include, but are not limited to, lentiviruses. Other retroviruses suitable for use in the compositions and methods of the present invention include Avian Leukosis Virus, Bovine Leukemia Virus, Murine Leukemia Virus, Mink-Cell Induced Virus ( Mink-Cell Focus-Inducing Virus, Murine Sarcoma Virus, Reticuloendotheliosis virus, and Raus sarcoma virus. Particularly preferred murine leukemia viruses are 4070A and 1504A (Hartley and Rowe. 1976. J. Virol. 19: 19-25), Abelson (ATCC No. VR-999), Friend (ATCC No. VR-245, Graffi, Gros (ATCC No. VR-590), Kirsteni Harvey Sarcoma Virus and Rauscher (ATCC No. VR-998. ), And Moloney Murine Leukemia Virus (ATCC No. VR-190). Such retroviruses are readily available from depository or collection agencies such as the American Type Culture Collection (ATCC, Manassas, VA) or can be isolated from known sources using commercially available techniques. Others are commercially available.

하나의 양태에서, 본 발명의 레트로바이러스 벡터 서열은 렌티바이러스로부터 기원할 수 있다. 바람직한 렌티바이러스는 사람 면역결핍성 바이러스, 예를 들면, 제1 형 또는 제2 형(즉, HIV-1 또는 HIV-2, 여기서, HIV-1는 이미 림프절병 관련 바이러스 3(HTLV-III) 및 후천성 면역결핍증(AIDS)-관련 바이러스(ARV)로 불렸다), 또는 AIDS 또는 ADIS-유사 질환으로 확인되고 이와 관련된 HIV-1 또는 HIV-2와 관련된 다른 바이러스이다. 다른 렌티바이러스는 양 비스나(Visna)/매디(maedi) 바이러스, 고양이 면역결핍증 바이러스(FIV), 소 렌티바이러스, 시미안 면역결핍성 바이러스(SIV), 말 감염성 백혈병 바이러스(EIAV), 및 염소 관절염-뇌염 바이러스(CAEV)를 포함한다. In one embodiment, the retroviral vector sequences of the invention may originate from lentiviruses. Preferred lentiviruses are human immunodeficiency viruses, such as type 1 or type 2 (ie HIV-1 or HIV-2, where HIV-1 is already associated with lymphadenopathy virus 3 (HTLV-III) and Called acquired immunodeficiency syndrome (AIDS) -associated virus (ARV)), or other virus associated with HIV-1 or HIV-2 identified as and related to AIDS or ADIS-like disease. Other lentiviruses include sheep Visna / maedi virus, feline immunodeficiency virus (FIV), bovine lentivirus, simian immunodeficiency virus (SIV), equine infectious leukemia virus (EIAV), and goat arthritis Encephalitis virus (CAEV).

레트로바이러스의 적합한 유전자 및 균주는 당해 분야에 잘 공지되어 있다(참조: 예를 들면, 본원에 참조로 인용된 Fields Virology, Third Edition, edited by B. N. Fields et al. 1996. Lippincott-Raven Publishers, 참조: 예를 들면, Chapter 58, Retroviridae: The Viruses and Their Replication, Classification, pages 1768-1771, 이의 표 1 포함). 생산자 세포를 생성하기 위한 레트로바이러스 패키징 시스템 및 레트로바이러스를 생산하는 생산자 세포주, 및 이러한 패키징 시스템을 제조하는 방법 또한 당해 분야에 공지되어 있다.Suitable genes and strains of retroviruses are well known in the art (see, eg, Fields Virology, Third Edition, edited by BN Fields et al. 1996. Lippincott-Raven Publishers, see: See, eg, Chapter 58, Retroviridae: The Viruses and Their Replication, Classification, pages 1768-1771, including Table 1 thereof. Retroviral packaging systems for producing producer cells and producer cell lines that produce retroviruses, and methods of making such packaging systems are also known in the art.

일반적인 패키징 시스템은 적어도 2개의 패키징 벡터: gag, pol, 또는 gag 및 pol 유전자를 포함하는 제1의 뉴클레오타이드 서열을 포함하는 제1의 패키징 벡터; 및 이종 또는 기능적으로 변형된 엔벨로프 유전자를 포함하는 제2의 뉴클레오타이드 서열을 포함하는 제2의 패키징 벡터를 포함한다. 레트로바이러스 성분은 HIV와 같은 렌티바이러스로부터 기원할 수 있다. 벡터는 기능적인 tat 유전자 및/또는 기능적인 보조 유전자(vif, vpr, vpu, vpx, nef)를 결여할 수 있다. 시스템은 rev 유전자를 포함하는 뉴클레오타이드 서열을 지닌 제3의 패키징 벡터를 추가로 포함할 수 있다. 패키징 시스템은 제1, 제2, 및 임의로 제3의 뉴클레오타이드 서열을 함유하는 패키징 세포의 형태로 제공될 수 있다.Typical packaging systems include at least two packaging vectors: a first packaging vector comprising a gag, pol, or a first nucleotide sequence comprising gag and pol genes; And a second packaging vector comprising a second nucleotide sequence comprising a heterologous or functionally modified envelope gene. Retroviral components may originate from lentiviruses such as HIV. The vector may lack functional tat genes and / or functional accessory genes (vif, vpr, vpu, vpx, nef). The system may further comprise a third packaging vector having a nucleotide sequence comprising a rev gene. The packaging system can be provided in the form of a packaging cell containing the first, second, and optionally third nucleotide sequences.

양태들에서, 각종 발현 시스템, 특히 진핵 세포 및 유리하게는 포유동물 세포를 사용하는 것들에 대한 적용성이 존재한다. 천연 단백질이 당화되는 경우, 바람직한 양태는 발현된 단백질에 대해 천연-유사 당화를 제공할 발현 시스템을 포함할 수 있다.In aspects, there is applicability to various expression systems, in particular those using eukaryotic cells and advantageously mammalian cells. When natural proteins are glycosylated, preferred embodiments may include expression systems that will provide natural-like glycosylation for the expressed protein.

렌티바이러스는 일반적으로 env 유전자에 의해 암호화된 엔벨로프 당단백질 SU (gp120) 및 TM (gp41); gag 유전자에 의해 암호화된 CA(p24), MA(p17) 및 NC(p7-11); pol 유전자에 의해 암호화된 RT, PR 및 IN을 포함하는 몇개의 구조적 비리온 단백질을 공유한다. HIV-1 및 HIV-2는 바이러스 RNA 및 다른 복제성 기능의 합성 및 프로세싱의 조절에 관여된 보조 및 다른 단백질을 함유한다. vif, vpr, vpu/vpx, 및 nef 유전자에 의해 암호화된 보조 단백질은 재조합체 시스템으로부터 제외(또는 불활성화)될 수 있다. 또한, tat 및 rev는 예를 들면, 돌연변이 또는 결실에 의해 제외되거나 불활성화될 수 있다.Lentiviruses generally include envelope glycoproteins SU (gp120) and TM (gp41) encoded by the env gene; CA (p24), MA (p17) and NC (p7-11) encoded by the gag gene; It shares several structural virion proteins, including RT, PR and IN, encoded by the pol gene. HIV-1 and HIV-2 contain auxiliary and other proteins involved in the regulation of the synthesis and processing of viral RNA and other replication functions. Auxiliary proteins encoded by vif, vpr, vpu / vpx, and nef genes can be excluded (or inactivated) from the recombinant system. In addition, tat and rev can be excluded or inactivated by, for example, mutations or deletions.

제1 세대 렌티바이러스 벡터 패키징 시스템은 gag/pol 및 env에 대한 별개의 패키징 작제물을 제공하며, 전형적으로 안전성 이유로 이종의 또는 기능적으로 변형된 엔벨로프 단백질을 사용한다. 제2 세대 렌티바이러스 벡터 시스템에서, 보조 유전자, vif, vpr, vpu 및 nef는 결실되거나 불활성화된다. 제3 세대 렌티바이러스 벡터 시스템은, 이로부터 tat 유전자가 결실되거나 또는 기타의 경우 불활성화되는(예를 들면, 돌연변이를 통해) 것들이다.First generation lentiviral vector packaging systems provide separate packaging constructs for gag / pol and env, and typically use heterologous or functionally modified envelope proteins for safety reasons. In the second generation lentiviral vector system, accessory genes, vif, vpr, vpu and nef are deleted or inactivated. Third generation lentiviral vector systems are those from which the tat gene is deleted or otherwise inactivated (eg, via a mutation).

tat에 의해 일반적으로 제공된 전사 조절용 보상은 사람 사이토메갈로바이러스 이미디어트 얼리(immediate early)(HCAAV-IE) 인핸서/프로모터와 같은 강력한 구성적 프로모터의 사용에 의해 제공될 수 있다. 다른 프로모터/인핸서는 구성적 프로모터 활성의 강도, 표적 조직에 대한 특이성(예를 들면, 간-특이적인 프로모터), 또는 당해 분야에서 이해되는 바와 같이, 발현에 걸쳐 바람직한 제어와 관련된 다른 인자들을 기준으로 선택될 수 있다. 예를 들면, 일부 양태에서, 제어된 발현을 달성하기 위해 tet와 같은 유도성 프로모터를 사용하는 것이 바람직하다. rev를 암호화하는 유전자는 별개의 발현 작제물에서 제공되어, 대표적인 제3 세대 렌티바이러스 벡터 시스템이 4개의 플라스미드: gagpol, rev, envelope에 대해 각각 1개 및 전달 벡터를 포함할 수 있다. 사용된 패키징 시스템의 세대에 상관없이, gag 및 pol은 단일 작제물 상에 또는 별개의 작제물 상에 제공될 수 있다.Compensation for transcriptional regulation generally provided by tat may be provided by the use of potent constitutive promoters such as human cytomegalovirus immediate early (HCAAV-IE) enhancer / promoter. Other promoters / enhancers are based on the strength of constitutive promoter activity, specificity to the target tissue (eg, liver-specific promoters), or other factors related to desirable control over expression, as understood in the art. Can be selected. For example, in some embodiments, it is desirable to use an inducible promoter such as tet to achieve controlled expression. Genes encoding rev are provided in separate expression constructs so that a representative third generation lentiviral vector system can include one and four delivery vectors for each of the four plasmids: gagpol, rev, envelope. Regardless of the generation of packaging system used, gag and pol may be provided on a single construct or on separate constructs.

전형적으로, 패키징 벡터는 패키징 세포내에 포함되며, 형질감염, 형질유도 또는 감염을 통해 세포내로 도입된다. 형질감염, 형질도입 또는 감염을 위한 방법은 당해 분야의 숙련가에게 잘 공지되어 있다. 본 발명의 레트로바이러스 전달 벡터는 패키징 세포주내로, 형질감염, 형질도입 또는 감염에 의해 도입되어, 생산자 세포 또는 세포주를 생성할 수 있다. 본 발명의 패키징 벡터는 사람 세포 또는 세포주내로 예를 들면, 인산칼슘 형질감염, 지질감염 또는 전기천공을 포함하는 표준 방법에 의해 도입될 수 있다. 일부 양태에서, 패키징 벡터는 세포내로 우세한 선택가능한 마커, 예를 들면, neo, 디하이드로폴레이트 리덕타제(DHFR), 글루타민 합성효소 또는 ADA를 사용하여 함께 도입시킨 후, 적절한 약물의 존재하에서 선택 및 클론의 분리를 수반한다. 선택가능한 마커 유전자는 패키징 벡터에 의해 암호화된 유전자에 물리적으로 연결될 수 있다.Typically, the packaging vector is included in the packaging cell and introduced into the cell via transfection, transduction or infection. Methods for transfection, transduction or infection are well known to those skilled in the art. Retroviral delivery vectors of the invention can be introduced into a packaging cell line by transfection, transduction or infection to produce a producer cell or cell line. The packaging vector of the present invention can be introduced into human cells or cell lines by standard methods including, for example, calcium phosphate transfection, lipid infection or electroporation. In some embodiments, the packaging vector is introduced together using a predominant selectable marker, such as neo, dihydrofolate reductase (DHFR), glutamine synthetase or ADA, into the cell, followed by selection and in the presence of an appropriate drug. Entails isolation of the clones. The selectable marker gene may be physically linked to the gene encoded by the packaging vector.

패기징 기능이 적합한 패키징 세포에 의해 발현되도록 구조화된 적합한 세포주가 공지되어 있다. 예를 들면, 패키징 세포를 기술하고 있는 미국 특허 제5,686,279호; 및 문헌(참조: Ory et al. 1996. Proc. Natl. Acad. Sci. 93:11400-11406)을 참조한다. 안정한 세포주 생산의 추가의 기술은 문헌[참조: Dull et al. 1998. J. Virol. 72(11):8463-8471; 및 Zufferey et al. 1998. J. Virol. 72:9873-9880]에서 찾을 수 있다. Suitable cell lines are known which are structured such that the packaging function is expressed by suitable packaging cells. For example, US Pat. No. 5,686,279, which describes packaging cells; And Ory et al. 1996. Proc. Natl. Acad. Sci. 93: 11400-11406. Additional techniques for stable cell line production can be found in Dull et al. 1998. J. Virol. 72 (11): 8463-8471; And Zufferey et al. 1998. J. Virol. 72: 9873-9880.

문헌(참조: Zufferey et al. 1997. Nat. Biotechnol. 15:871-75)은 렌티바이러스 패키징 플라스미드를 교시하고 있으며, 여기서 HIV-1 엔벨로프 유전자를 포함하는 pol의 3' 서열은 결실되어 있다. 작제물은 tat 및 rev 서열을 함유하며 3' LTR은 폴리 A 서열로 대체된다. 5' LTR 및 psi 서열은 유도성인 것과 같은 다른 프로모터로 교체된다. 예를 들면, CMV 프로모터 또는 이의 유도체가 사용될 수 있다.Zufferey et al. 1997. Nat. Biotechnol. 15: 871-75 teach a lentiviral packaging plasmid wherein the 3 'sequence of pol comprising the HIV-1 envelope gene is deleted. The construct contains tat and rev sequences and the 3 'LTR is replaced with a poly A sequence. 5 'LTR and psi sequences are replaced with other promoters, such as inducible. For example, CMV promoters or derivatives thereof can be used.

패키징 벡터는 패키징 기능에 대한 추가의 변화를 함유함으로써 렌티바이러스 단백질 발현을 향상시키고 안전성을 향상시킬 수 있다. 예를 들면, gag의 상부의 HIV 서열 모두는 제거될 수 있다. 또한, 엔벨로프의 하부 서열은 제거될 수 있다. 또한, 단계들을 수행하여 벡터를 변형시킴으로써 RNA의 스플라이싱 및 해독을 향상시킬 수 있다.Packaging vectors can contain additional changes to packaging function to enhance lentiviral protein expression and improve safety. For example, all of the HIV sequences on top of the gag can be removed. In addition, the lower sequence of the envelope can be removed. In addition, steps can be performed to modify the vector to improve splicing and translation of the RNA.

임의로, 문헌(참조: Dull et al. 1998. 상기 참조)에 기술된 것과 같은, 조건화된 패키징 시스템을 사용한다. 또한, 예를 들면 문헌(Zufferey et al. 1998. J. Virol. 72:9873-9880)에 기술된 것으로서 HIV-1 긴 말단 반복체(LTR)의 결실에 의해 벡터의 생물안전성을 개선시키는 자가-불활성화 벡터(SIN)의 사용이 바람직하다. 유도성 벡터를 또한 예를 들면, 테트라사이클린-유도성 LTR을 통해 사용할 수 있다.Optionally, a conditioned packaging system, such as described in Dull et al. 1998, supra, is used. In addition, self-improvement of the vector's biosafety by deletion of HIV-1 long terminal repeats (LTR) as described, for example, in Zufferey et al. 1998. J. Virol. 72: 9873-9880. The use of an inactivation vector (SIN) is preferred. Inducible vectors can also be used, for example, via tetracycline-induced LTR.

프로모터Promoter

양태들에서, 본 발명의 벡터는 전형적으로 이종 제어 서열을 포함하며, 이는 사이토메갈로바이러스(CMV) 이미디에이트 얼리 프로모터, RSV LTR, MOMLV LTR, 및 PGK 프로모터; mTTR, TK, HBV, hAAT, 조절가능하거나 유도성인 프로모터를 포함하는 조직 또는 세포 유형 특이적인 프로모터, 인핸서 등과 같은 구성적 프로모터를 포함하나 이에 한정되지 않는 이종 제어 서열을 포함한다.In aspects, the vectors of the invention typically comprise heterologous control sequences, which include cytomegalovirus (CMV) imideate early promoter, RSV LTR, MOMLV LTR, and PGK promoters; heterologous control sequences, including but not limited to, constitutive promoters such as mTTR, TK, HBV, hAAT, tissue or cell type specific promoters including modulators or inducible promoters, enhancers, and the like.

특정의 유용한 프로모터는 LSP 프로모터(참조: III et al. 1997. Blood Coagul. Fibrinolysis 8S2:23-30), EF1-알파 프로모터[참조: Kim et al. 1990. Gene 91 (2):217-23) 및 Guo et al. 1996. Gene Ther. 3(9):802-10]를 포함한다. 가장 바람직한 프로모터는 연장 인자 1-알파(EF1a) 프로모터, 포스포글리세레이트 키나제-1(PGK) 프로모터, 사이토메갈로바이러스 이미디에이트 얼리 유전자(CMV) 프로모터, 키메라 간-특이적인 프로모터(LSP), 사이토메갈로바이러스 인핸서/닭 베타-액틴(CAG) 프로모터, 테트라사이클린 반응성 프로모터(TRE), 트랜스티레틴 프로모터(TTR), 시미안 바이러스 40(SV40) 프로모터 및 CK6 프로모터를 포함한다. 본 발명의 실시에 유용한 유리한 프로모터는 아데노바이러스 주요 레이트 프로모터(참조: Berkner and Sharp. 1985. Nucl. Acids Res. 13:841-857)이다. 관련 프로모터의 구조적 및 기능적 정보는 당해 분야에 공지되어 있다. 관련 서열은 공공의 데이타베이스로부터 용이하게 수득될 수 있으며 본 발명의 국면을 실시하는데 사용하기 위해 벡터내로 혼입될 수 있다.Certain useful promoters include the LSP promoter (III et al. 1997. Blood Coagul. Fibrinolysis 8S2: 23-30), the EF1-alpha promoter (Kim et al. 1990. Gene 91 (2): 217-23) and Guo et al. 1996. Gene Ther. 3 (9): 802-10. Most preferred promoters are elongation factor 1-alpha (EF1a) promoter, phosphoglycerate kinase-1 (PGK) promoter, cytomegalovirus imidate early gene (CMV) promoter, chimeric liver-specific promoter (LSP), cytosine Megalovirus enhancer / chicken beta-actin (CAG) promoter, tetracycline reactive promoter (TRE), transthyretin promoter (TTR), simian virus 40 (SV40) promoter and CK6 promoter. An advantageous promoter useful in the practice of the present invention is the adenovirus major rate promoter (Berkner and Sharp. 1985. Nucl. Acids Res. 13: 841-857). Structural and functional information of related promoters is known in the art. Related sequences can be readily obtained from public databases and incorporated into vectors for use in practicing aspects of the present invention.

본 발명의 실시에 특히 바람직한 프로모터는 아데노바이러스 주요 레이트 프로모터이다. 발현 카세트는 5'에서 3' 방향으로, 아데노바이러스 주요 레이트 프로모터, 목적한 단백질 또는 목적한 단백질 쇄에 대한 제1 암호화 서열에 대해 작동적인 3부(tripartite) 리더 서열, 자가 프로세싱 서열 또는 프로테아제 절단 서열을 암호화하는 서열, 목적한 단백질 또는 단백질 쇄에 대한 제2의 암호화 서열, 및 임의로 자가 프로세싱 서열 또는 프로테아제 절단 서열을 암호화하는 서열에 이어, 목적한 단백질 또는 단백질 쇄의 제3의 암호화 서열을 포함할 수 있다. 이들 암호화 서열들 모두는 공유결합적으로 연결되며 동일한 판독 프레임내에 존재함으로써 해독이 폴리프로테인 암호화 서열내에서 종결되지 않도록 한다. 단백질 합성 동안 또는 다중펩타이드의 합성의 완결 후 자가 프로세싱 또는 단백질분해 프로세싱은 폴리프로테인을 적절한 단백질 쇄 또는 단백질들로 절단한다. 면역글로불린 합성의 경우에, 경쇄에 대한 암호화 서열은 폴리프로테인 암호화 서열내에 2회로 존재한다. 유리하게는, 리더 서열 암호화 영역은 단백질 또는 단백질 쇄 서열과 관련될 수 있으며; 시그날 펩티다제에 의한 프로세싱은 프로세싱 부위의 하부의 단백질의 N-말단에서 특정의 잔류 아미노산 잔기를 제거하는 추가의 이점을 가질 수 있다. 면역글로불린 중쇄에 대한 성분은 Met, 단백질 개시 메티오닌; HC, 중쇄; LC, 경쇄, SPPC, 자가-프로세싱 또는 프로테아제 절단 부위이다. 면역글로불린 합성을 위한 발현 작제물은 다음을 포함할 수 있다: Met-프로테아제-SPPC- HC 리더 서열-HC-SPPC-LC 리더 서열-LC-SPPC-LC 리더 서열-LC; Met-프로테아제-SPPC-LC 리더 서열-LC-SPPC-LC 리더 서열-LC-SPPC-HC 리더 서열-HC; Met-프로테아제-SPPC- LC 리더 서열-LC-SPPC-HC 리더 서열-HC-SPPC-LC 리더 서열-LC; HC 리더 서열-HC-SPPC-LC 리더 서열-LC-SPPC-LC 리더 서열-LC; LC 리더 서열-LC-SPPC-HC 리더 서열-HC-SPPC-LC 리더 서열-LC; LC 리더 서열-LC-SPPC-LC 리더 서열-LC-SPPC-HC 리더 서열-HC; Met-프로테아제-SPPC-HC 리더-HC-SPPC-LC 리더-LC.Particularly preferred promoters in the practice of the present invention are adenovirus major rate promoters. The expression cassette is a 5 'to 3' direction, a tripartite leader sequence, a self processing sequence, or a protease cleavage sequence that is operative for the adenovirus major rate promoter, the first coding sequence for the protein of interest or protein chain of interest. Followed by a sequence encoding a protein, a second coding sequence for the protein or protein chain of interest, and optionally a sequence encoding a self processing sequence or protease cleavage sequence, followed by a third coding sequence of the protein or protein chain of interest. Can be. All of these coding sequences are covalently linked and present in the same reading frame so that translation is not terminated in the polyprotein coding sequence. Self-processing or proteolytic processing during protein synthesis or after completion of the synthesis of the multipeptide cleaves the polyprotein into appropriate protein chains or proteins. In the case of immunoglobulin synthesis, the coding sequence for the light chain is present twice in the polyprotein coding sequence. Advantageously, the leader sequence coding region can be associated with a protein or protein chain sequence; Processing with signal peptidase may have the added advantage of removing certain residual amino acid residues at the N-terminus of the protein below the processing site. Components for immunoglobulin heavy chains include Met, protein initiated methionine; HC, heavy chain; LC, light chain, SPPC, self-processing or protease cleavage site. Expression constructs for immunoglobulin synthesis may include: Met-protease-SPPC-HC leader sequence-HC-SPPC-LC leader sequence-LC-SPPC-LC leader sequence-LC; Met-protease-SPPC-LC leader sequence-LC-SPPC-LC leader sequence-LC-SPPC-HC leader sequence-HC; Met-protease-SPPC-LC leader sequence-LC-SPPC-HC leader sequence-HC-SPPC-LC leader sequence-LC; HC leader sequence-HC-SPPC-LC leader sequence-LC-SPPC-LC leader sequence-LC; LC leader sequence-LC-SPPC-HC leader sequence-HC-SPPC-LC leader sequence-LC; LC leader sequence-LC-SPPC-LC leader sequence-LC-SPPC-HC leader sequence-HC; Met-protease-SPPC-HC leader-HC-SPPC-LC leader-LC.

항체를 포함하는 생물치료제 분자Biotherapeutic Molecules Including Antibodies

본 발명의 영역내에서, 특수하게 발현된 항체(면역글로불린)은 특히 종양 괴사 인자[HUMIRA/D2E7(애보트 바이오테크놀로지 리미티드(Abbott Biotechnology Ltd., 버뮤다 해밀톤 소재)에 상응하고/하거나 기원한 가공된 항체]; 인터루킨-12(ABT-874로부터 기원한 가공된 항체); 인터루킨-18(ABT-325로부터 기원한 가공된 항체); 재조합체 에리트로포이에틴 수용체(ABT-007로부터 기원한 가공된 항체); 또는 E/L 셀렉틴(EL246-GG로부터 기원한 가공된 항체)를 포함할 수 있다. 가공된 폴리프로테인의 암호화 및 아미노산 서열은 본원에 기재되어 있거나 당해 분야에서 사용가능하다. 본 발명에 적합한 추가의 항체는 예를 들면, 레미케이드(인플릭시마브); 리툭산/마브테라(리툭시마브); 헤르셉틴(트라스투주마브); 아바스틴(베바키주마브); 시나기스(팔리비주마브); 에르비툭스(세툭시마브); 레오프로(아브킥시마브); 오르토클론 OKT3(무로모나브-CD3); 제나팍스(다클리주마브); 시물렉트(바실릭시마브); 마일로타르그(겜투주마브); 캄패쓰(알렘투주마브); 제발린(이브리투모마브); 크솔라이르(오말리주마브); 벡사르(토시투모마브); 및 라프티바(에팔리주마브)를 포함하며; 여기서 일반적으로 상표-제품명은 괄호안의 각각의 일반명으로 이어온다. 추가의 적합한 단백질은 예를 들면, 하나 이상의 에포에틴 알파, 에포에틴 베타, 에타네르셉트, 다르베포에틴 알파, 필그라스팀, 인터페론 베타 1a, 인터페론 베타 1b, 인터페론 알파-2b, 인슐린 글라르긴, 소마트로핀, 테리파라티드, 폴리트로핀 알파, 도르나제, 인자 VIII, 인자 VII, 인자 IX, 이미글루세라제, 네시리티드, 레노그라스팀 및 폰 빌레브란트 인자(Von Willebrand factor)를 포함하며; 여기서 하나 이상의 일반 지명은 각각 제품의 하나 이상의 상표-제품 명에 상응할 수 있다. 다른 항체 및 단백질도 당해 분야에서 이해되는 바와 같이 본 발명에 적합하다.Within the scope of the present invention, specifically expressed antibodies (immunoglobulins) are in particular processed antibodies corresponding to and / or originating tumor necrosis factor [HUMIRA / D2E7 (Abbott Biotechnology Ltd., Hamilton, Bermuda) Interleukin-12 (engineered antibody originating from ABT-874); interleukin-18 (engineered antibody originating from ABT-325); recombinant erythropoietin receptor (engineered antibody originating from ABT-007); Or E / L selectin (a processed antibody derived from EL246-GG) The coding and amino acid sequences of the processed polyproteins are described herein or may be used in the art. Antibodies include, for example, remicade (infliximab); rituxan / mabterra (rituximab); herceptin (trastuzumab); avastin (bevacizumab); cinagis (palivizumab); erbi Tux Shimab); Leopro (Abkicksimab); Orthoclonal OKT3 (Muromonab-CD3); Jenafax (Daclixumab); Seelect (Basiclikmab); Mylotarg (Gemtuzumab) ; Campathes (alemtuzumab); zevalin (ibritumomab); xsolaire (omalizumab); bexsar (tositumomab); and raftiva (epalizooma); Generally, the trademark-product name follows each generic name in parentheses: Further suitable proteins are, for example, one or more epoetin alpha, epoetin beta, etanercept, darbepoetin alpha, filgrastim, interferon beta 1a, interferon beta 1b, interferon alpha-2b, insulin glargine, somatropin, teriparatide, polytropin alpha, dornase, factor VIII, factor VII, factor IX, imiglucerase, necitrides, Renograstim and Von Willebrand factor; One or more generic names may each correspond to one or more trademark-product names of the product Other antibodies and proteins are also suitable for the present invention as is understood in the art.

본 발명은 또한 2개 이상의 목적하는 폴리펩타이드 또는 단백질 또는 프로단백질에 대한 암호화 서열의 제어된 발현을 고려한다. 유전자 조절 시스템은 특수 유전자 또는 유전자들의 조절된 발현에 유용하다. 하나의 예시적인 시도에서, 유전자 조절 시스템 또는 스위치(switch)는 리간드 결합 도메인, 전사 활성화 도메인 및 DNA 결합 도메인을 갖는 키메라 전사 인자를 포함한다. 도메인은 사실상 어떠한 공급원으로부터 수득될 수 있고 신규 단백질을 수득하기 위한 다수의 방식들 중 어느 것을 결합시킬 수 있다. 조절가능한 유전자 시스템은 또한 키메라 전사 인자와 상호작용하는 DNA 반응 성분을 포함한다. 이러한 전사 조절 성분은 조절될 유전자에 인접하게 위치한다.The present invention also contemplates the controlled expression of coding sequences for two or more desired polypeptides or proteins or proproteins. Genetic control systems are useful for the controlled expression of specific genes or genes. In one exemplary attempt, a gene regulatory system or switch comprises a chimeric transcription factor having a ligand binding domain, a transcriptional activation domain and a DNA binding domain. The domain can be obtained from virtually any source and can combine any of a number of ways to obtain new proteins. The regulated gene system also includes a DNA response component that interacts with chimeric transcription factors. Such transcriptional regulatory components are located adjacent to the gene to be regulated.

본 발명을 실시하는데 사용될 수 있는 예시적인 전사 조절 시스템은 예를 들면, 드로소필라 엑다이손 시스템(Drosophila ecdysone system)(참조: Yao et al. 1996. Proc. Natl. Acad. Sci. 93:3346), 봄빅스 엑다이손 시스템(Bombyx ecdysone system)(참조: Suhr et al. 1998. Proc. Natl. Acad. Sci. 95:7999), 유도인자로서 RU486을 사용하는 진스위치(GeneSwitch)[텍사스주 우드랜드 소재의 발렌티스(Valentis)의 상표명] 합성 프로게스테론 수용체 시스템(참조: Osterwalder et al. 2001 . Proc. Natl. Acad. Sci. USA 98(22):12596-601); 테트라사이클린(Tc) 또는 유사체, 예를 들면 독시사이클린과 같은 소 분자를 사용하여 표적의 전사를 조절[작동(turn on) 또는 비작동(turn off)]시키는 Tet 및 RevTet 시스템[테트라사이클린 조절된 발현 시스템, 캘리포니아주 마운틴 뷰 소재의 비디 바이오사이언시즈 클론테크(BD Biosciences Clontech)][참조: Knott et al. 2002. Biotechniques 32(4):796, 798, 800]; 이들 각각이 전사 활성인자 또는 DNA 결합 단백질에 연결된, 2개의 세포내 분자와 함께 오는 소 분자의 사용을 기초로 하는 ARIAD 조절 기술[아리아드(Ariad), 매사추세츠주 캠브릿지 소재]을 포함한다. 이들 성분들이 함께 오는 경우, 목적하는 유전자의 전사가 활성화된다. 아리아드는 단독이합체를 기준으로 하는 시스템 및 이종이합체를 기준으로 하는 시스템을 갖는다[참조: Rivera et al. 1996. Nature Med. 2(9):1028-1032; Ye et al. 2000. Science 283:88-91].Exemplary transcriptional control systems that can be used to practice the invention include, for example, the Drosophila ecdysone system (see Yao et al. 1996. Proc. Natl. Acad. Sci. 93: 3346). ), Bombyx ecdysone system (Suhr et al. 1998. Proc. Natl. Acad. Sci. 95: 7999), GeneSwitch using RU486 as an inducer (Texas) Trademark of Valentis, Woodland] Synthetic progesterone receptor system (Osterwalder et al. 2001. Proc. Natl. Acad. Sci. USA 98 (22): 12596-601); Tet and RevTet systems [tetracycline regulated expression systems] that use small molecules such as tetracycline (Tc) or analogs, for example doxycycline, to regulate (turn on or turn off) transcription of the target BD Biosciences Clontech, Mountain View, Calif., Knott et al. 2002. Biotechniques 32 (4): 796, 798, 800; Each of these includes ARIAD regulation techniques (Ariad, Cambridge, Mass.) Based on the use of small molecules that come with two intracellular molecules linked to transcriptional activators or DNA binding proteins. When these components come together, the transcription of the gene of interest is activated. Ariads have a system based on homodimers and a system based on heterodimers. Rivera et al. 1996. Nature Med. 2 (9): 1028-1032; Ye et al. 2000. Science 283: 88-91.

항체 또는 이의 단편을 암호화하는 핵산 서열 또는 자가-프로세싱 또는 프로테아제-절단된 재조합체 다중펩타이드의 형태의 다른 이종 단백질 또는 프로-단백질을 포함하는 본 발명의 발현 벡터 작제물의 양태를 외부의 치료제 또는 이식유전자의 세포내, 예를 들면, 체세포내 전달을 위한 시험관내, 생체외 또는 생체내, 또는 벡터-형질도입된 세포에 의한 재조합체 폴리펩타이드의 생산시 세포내로 도입시킬 수 있다.Aspects of an expression vector construct of the invention comprising a nucleic acid sequence encoding a antibody or fragment thereof or another heterologous protein or pro-protein in the form of a self-processing or protease-cleaved recombinant multipeptide may be used as an external therapeutic or transplant The gene can be introduced intracellularly, for example in vitro, ex vivo or in vivo for somatic cell delivery, or intracellularly in the production of recombinant polypeptides by vector-transduced cells.

숙주 세포 및 벡터의 전달Delivery of Host Cells and Vectors

본 발명의 벡터 작제물은 당해 분야에 공지된 표준 방법론을 사용하여 시험관내 또는 생체외에서 적합한 세포내로 도입시킬 수 있다. 이러한 기술은 예를 들면, 인산칼슘을 사용한 형질감염, 배양된 세포내로의 미세주입(참조: Capecchi. 1980. Cell 22:479-488), 전기천공(참조: Shigekawa et al. 1988. BioTechnology 6:742-751), 리포솜-매개된 유전자 전달(참조: Mannino et al. 1988. BioTechnology 6:682-690), 지질-매개된 형질도입(참조: Feigner et al. 1987. Proc. Natl. Acad. Sci. USA 84:7413-7417), 및 고-속 미세 발사체(high-velocity microprojectile)를 사용한 핵산 전달(참조: Klein et al. 1987. Nature 327:70-73)을 포함한다.Vector constructs of the invention can be introduced into suitable cells in vitro or ex vivo using standard methodologies known in the art. Such techniques include, for example, transfection with calcium phosphate, microinjection into cultured cells (see Capecchi. 1980. Cell 22: 479-488), electroporation (see Shigekawa et al. 1988. BioTechnology 6: 742-751), liposome-mediated gene delivery (Mannino et al. 1988. BioTechnology 6: 682-690), lipid-mediated transduction (Feigner et al. 1987. Proc. Natl. Acad. Sci USA 84: 7413-7417), and nucleic acid delivery using high-velocity microprojectiles (Klein et al. 1987. Nature 327: 70-73).

시험관내 또는 생체외 발현을 위해, 기능성 단백질 생성물을 발현시키는데 효과적인 어떠한 세포도 사용할 수 있다. 단백질 발현을 위해 사용된 세포 및 세포주의 다수의 예가 당해 분야에 공지되어 있다. 예를 들면, 원핵 세포 및 곤충 세포를 발현에 사용할 수 있다. 또한, 효모와 같은 진핵 미생물도 사용할 수 있다. 원핵, 곤충 및 효모 시스템에서 재조합체 단백질의 발현은 일반적으로 당해 분야에 공지되어 있으며 본 발명의 조성물 및 방법을 사용하여 항체 또는 다른 단백질 발현을 위해 조정할 수 있다.For in vitro or ex vivo expression, any cell effective for expressing the functional protein product can be used. Many examples of cells and cell lines used for protein expression are known in the art. For example, prokaryotic and insect cells can be used for expression. Eukaryotic microorganisms such as yeast can also be used. Expression of recombinant proteins in prokaryotic, insect and yeast systems is generally known in the art and can be adjusted for antibody or other protein expression using the compositions and methods of the present invention.

발현에 유용한 세포의 예는 또한 포유동물 세포, 예를 들면, 섬유모세포, 비-사람 포유동물로부터의 세포, 예를 들면, 조류, 돼지, 뮤린 및 소 세포, 곤충세포 등으로부터의 세포를 포함한다. 포유동물 세포의 특이적인 예는 COS 세포, VERO 세포, HeLa 세포, 차이니즈 햄스터 난소(CHO) 세포, CHO DX B11 세포, CHO DG44 세포, PerC.6 세포, Sp2/0 세포, 293 세포, NSO 세포, 3T3 섬유모세포, W138 세포, BHK 세포, HEPG2 세포, 및 MDCK 세포를 포함하나, 이에 한정되지 않는다.Examples of cells useful for expression also include mammalian cells, such as fibroblasts, cells from non-human mammals, such as cells from birds, pigs, murine and bovine cells, insect cells, and the like. . Specific examples of mammalian cells include COS cells, VERO cells, HeLa cells, Chinese hamster ovary (CHO) cells, CHO DX B11 cells, CHO DG44 cells, PerC.6 cells, Sp2 / 0 cells, 293 cells, NSO cells, 3T3 fibroblasts, W138 cells, BHK cells, HEPG2 cells, and MDCK cells, including but not limited to.

숙주 세포는 프로모터를 유도하거나, 형질전환체를 선택하거나, 목적하는 서열을 암호화하는 유전자를 증폭시키기 위해 적절하게 변형된 통상의 영양 배지 속에서 배양된다. 포유동물 숙주 세포는 각종 배지 속에서 배양될 수 있다. 시판되는 배지, 예를 들면, Ham's F10[제조원: 시그마(Sigma)], 최소 필수 배지(MEM)(제조원: 시그마), RPMI 1640(제조원: 시그마), 최소 필수 배지(MEM) 알파 배지, 및 둘베코 변형된 이글스 배지(Dulbecco's Modified Eagle's Medium)(DMEM)(제조원: 시그마)가 전형적으로 숙주 세포를 배양하는데 적합하다. 제공된 배지는 일반적으로 경우에 따라 호르몬 및/또는 다른 성장 인자(예를 들면, 인슐린, 트랜스페린 또는 상피 성장 인자), 염(예를 들면, 염화나트륨, 칼슘, 마그네슘 및 포스페이트), 완충액(예를 들면, HEPES), 뉴클레오사이드(예를 들면, 아데노신 및 티미딘), 항생제, 미량 성분, 및 글루코즈 또는 동등한 에너지원으로 보충된다. 어떠한 다른 필수 보충물도 또한 당해 분야의 숙련가에게 잘 공지된 적절한 농도로 포함될 수 있다. 특수 세포주에 대한 적절한 배양 조건, 예를 들면, 온도, pH 등은 예를 들면, ATCC 카탈로그("atcc.org/SearchCatalogs/AIICollections.cfm"에서 인터넷으로 사용가능하거나 시판 공급업자에 의해 지시된 바와 같음)에서, 다수의 세포주의 배양을 위한 제안된 배양물 조건과 함께, 당해 분야에 일반적으로 공지되어 있다.Host cells are cultured in conventional nutrient media suitably modified to induce a promoter, select a transformant, or amplify a gene encoding a sequence of interest. Mammalian host cells can be cultured in a variety of media. Commercially available media such as Ham's F10 (manufactured by Sigma), minimum mandatory medium (MEM) (manufactured by Sigma), RPMI 1640 (manufactured by Sigma), minimum mandatory medium (MEM) alpha medium, and two Dulbecco's Modified Eagle's Medium (DMEM) (Sigma) is typically suitable for culturing host cells. Provided media generally will optionally include hormones and / or other growth factors (eg, insulin, transferrin or epidermal growth factor), salts (eg, sodium chloride, calcium, magnesium and phosphate), buffers (eg, HEPES), nucleosides (eg adenosine and thymidine), antibiotics, trace components, and glucose or equivalent energy sources. Any other necessary supplements may also be included at appropriate concentrations well known to those skilled in the art. Appropriate culture conditions for particular cell lines, such as temperature, pH, etc., are available, for example, on the Internet in the ATCC catalog (“atcc.org/SearchCatalogs/AIICollections.cfm” or as directed by a commercial supplier). ) Are generally known in the art, along with suggested culture conditions for the cultivation of multiple cell lines.

발현 벡터를 생체내에서 각종 경로(예를 들면, 피내, 정맥내, 종양내, 뇌내로, 문맥내, 복강내, 근육내, 방광내 등)를 통해 투여하여 자가 프로세싱 절단 서열을 통해 연결된 다수의 유전자를 전달함으로써 동물 모델 또는 사람 대상체에서 2개 이상의 단백질 또는 폴리펩타이드를 발현시킬 수 있다. 투여 경로에 의존하여, 치료용 단백질은 국소적으로(뇌 또는 방광내에서) 또는 전신계적으로(다른 투여 경로) 이들의 효과를 발휘한다. 전사 해독 프레임(들)에 대한 조직 특이적인 프로모터 5'의 사용은 전체 전사 해독 프레임에 의해 암호화된 단백질 또는 폴리펩타이드의 조직 특이적인 발현을 생성한다.Expression vectors may be administered in vivo via various pathways (eg, intradermal, intravenous, intratumoral, intracranial, intraportal, intraperitoneal, intramuscular, in the bladder, etc.) to connect a number of self-processing cleavage sequences. By delivering a gene, two or more proteins or polypeptides can be expressed in an animal model or a human subject. Depending on the route of administration, therapeutic proteins exert their effects locally (in the brain or bladder) or systemically (other routes of administration). The use of tissue specific promoter 5 'for transcription translation frame (s) results in tissue specific expression of the protein or polypeptide encoded by the entire transcription translation frame.

시험관내, 생체외 또는 생체내에서 표적 세포내로 이식유전자를 운반하는 재조합체 발현 벡터를 도입하는 각종 방법이 이미 기재되어 있고 당해 분야에 잘 공지되어 있다. 본 발명은 표적화된 세포를 2개 이상의 목적한 단백질 또는 폴리펩타이드에 대한 암호화 서열을 함유하는 재조합체 벡터로 감염시키고, 표적화된 세포내에서 단백질 또는 폴리펩타이드를 발현시킴에 의한 치료학적 방법, 백신 및 암 치료요법을 제공한다.Various methods of introducing recombinant expression vectors that carry transgenes into target cells in vitro, ex vivo or in vivo have already been described and are well known in the art. The present invention relates to therapeutic methods, vaccines and vaccines by infecting a targeted cell with a recombinant vector containing coding sequences for two or more desired proteins or polypeptides and expressing the protein or polypeptide in the targeted cells. Provide cancer therapy.

예를 들면, 본 발명의 재조합체 벡터의 생체내 전달은 뇌, 간, 혈관, 근육, 심장, 폐 및 피부를 포함하나, 이에 한정되지 않는 광범위한 기관 유형에 표적화될 수 있다.For example, in vivo delivery of recombinant vectors of the invention can be targeted to a wide variety of organ types, including but not limited to brain, liver, blood vessels, muscle, heart, lung and skin.

생체외 유전자 전달의 경우에, 표적 세포를 숙주로부터 제거하고 본 발명의 재조합체 벡터 및 당해 분야에 공지된 방법을 사용하여 실험실에서 유전적으로 변형시킨다.In the case of ex vivo gene delivery, target cells are removed from the host and genetically modified in the laboratory using recombinant vectors of the invention and methods known in the art.

본 발명의 재조합체 벡터는 위에서 기술한 양식을 포함하나 이에 한정되지 않는 통상적인 방식을 사용하여 투여할 수 있다. 본 발명의 재조합체 벡터는 액체 용액 및 현탁액, 미세소낭, 리포솜 및 주사가능하거나 주입가능한 용액을 포함하나, 이에 한정되지 않는 각종 제형일 수 있다. 바람직한 형태는 투여 방식 및 치료학적 적용에 의존한다.Recombinant vectors of the invention can be administered using conventional manners, including but not limited to the forms described above. Recombinant vectors of the invention may be in various formulations including, but not limited to, liquid solutions and suspensions, microvesicles, liposomes, and injectable or injectable solutions. Preferred forms depend on the mode of administration and therapeutic application.

양태들에서, 생체내에서 면역글로불린 또는 다른 생물학적으로 활성인 단백질 생산에 있어서 발현 벡터 작제물의 장점은 단일 벡터의 장기간 투여 및 환자에서 지속적인 항체 발현; 충분한 생물학적 활성을 가진 항체 또는 이의 단편(또는 다른 생물학적으로 활성인 단백질)의 생체내 발현; 및 사람 세포에서 생성된 항체의 천연의 후해독적 변형을 포함한다. 바람직하게는, 발현된 단백질은 천연적으로 존재하는 단백질과 동일하거나 또는 충분히 동일하여 면역학적 반응이 감소되거나 개시(trigger)되지 않으며 여기서 발현된 단백질은 상기 단백질을 필요로 하는 환자에서 다수 경우에 투여되거나 지속적으로 발현된다.In aspects, the advantages of expression vector constructs in the production of immunoglobulins or other biologically active proteins in vivo include long-term administration of a single vector and sustained antibody expression in patients; In vivo expression of an antibody or fragment thereof (or other biologically active protein) with sufficient biological activity; And natural post-detoxification modifications of antibodies produced in human cells. Preferably, the expressed protein is identical or sufficiently identical to a naturally occurring protein such that the immunological response is not reduced or triggered, wherein the expressed protein is administered in many cases in a patient in need of said protein. Or continuously expressed.

본 발명의 재조합체 벡터 작제물의 양태는 치료요법 또는 연구에서 사용하기 위한 재조합체 항체 및 다른 생물학적으로 활성인 단백질의 시험관내 생산에서 추가의 유용성을 발견한다. 재조합체 단백질 생산 방법은 당해 분야에 잘 공지되어 있으며 본원에 기술된 자가 프로세싱 절단 부위 또는 다른 프로테아제 절단 부위-함유 벡터 작제물을 사용하여 재조합체 항체의 발현에 사용할 수 있다.Embodiments of the recombinant vector constructs of the present invention find additional utility in the in vitro production of recombinant antibodies and other biologically active proteins for use in therapy or research. Recombinant protein production methods are well known in the art and can be used for expression of recombinant antibodies using the self processing cleavage sites or other protease cleavage site-containing vector constructs described herein.

하나의 국면에서, 본 발명은 위에서 기술한 바와 같은 발현 벡터를 세포내로 도입시켜 형질감염된 세포를 수득함으로써 재조합체 면역글로불린 또는 이의 단편을 생산하는 방법을 제공하며, 여기서 벡터는 5' 내지 3' 방향으로: 면역글로불린 중쇄 및 경쇄 또는 이의 단편에 대한 암호화 서열에 작동적으로 연결된 프로모터, 상기 쇄들 각각 사이의 자가 프로세싱 서열을 포함한다. 면역글로불린 중쇄에 대한 암호화 서열 또는 면역글로불린 경쇄에 대한 암호화 서열은 제공된 벡터 작제물에서 자가 프로세싱 서열에 대해 5'(즉, 제1)일 수 있다.In one aspect, the invention provides a method for producing a recombinant immunoglobulin or fragment thereof by introducing an expression vector as described above into a cell to obtain a transfected cell, wherein the vector is in the 5 'to 3' direction. By: a promoter operably linked to the coding sequence for the immunoglobulin heavy and light chains or fragments thereof, the self processing sequence between each of the chains. The coding sequence for the immunoglobulin heavy chain or the coding sequence for the immunoglobulin light chain can be 5 '(ie, first) to the self processing sequence in the provided vector construct.

항체를 위한 작제물의 양태에서, 항체 또는 면역글로불린 또는 이의 단편에 대한 제1 또는 제2 쇄를 암호화하는 서열은 IgG, IgM, IgD, IgE 또는 IgA로부터 기원한 중쇄 또는 이의 단편을 포함한다. 광범위하게 기술된 바와 같이, 항체 또는 면역글로불린 또는 이의 단편에 대한 쇄를 암호화하는 서열은 또한 IgG, IgM, IgD, IgE 또는 IgA로부터의 경쇄 또는 이의 단편을 포함한다. 본 발명의 양태들은 전체 항체 분자들 및 예를 들면 Fab, 일본쇄 Fv (scFv) 및 F(ab')2와 같은 다른 항원 인식 분자 단편을 포함하는, 이의 변형되거나 기원된 형태에 대한 단백질에 상응하는 유전자에 관한 것이다. 항체 및 단편은 동물-기원하거나, 사람-마우스 키메라이거나, 사람화되거나, Deimmunisation™[제조원: 바이오베이션 리미티드(Biovation Ltd)]에 의해 변경되거나, Fc 수용체에 대한 친화성이 변화하도록 변경되거나, 완전한 사람일 수 있다. 리간드-결합 분자의 양태는 당해 분야에서 이해되는 바와 같이 친화성이 성숙될 수 있다. 바람직한 양태들에서, 항체 또는 다른 재조합체 단백질은 이것이 투여되는 사람 또는 동물에서 면역 반응을 끌어내지 않거나 최소한으로 유발한다.In an embodiment of a construct for an antibody, the sequence encoding the first or second chain for the antibody or immunoglobulin or fragment thereof comprises a heavy chain or fragment thereof derived from IgG, IgM, IgD, IgE or IgA. As broadly described, the sequences encoding chains for antibodies or immunoglobulins or fragments thereof also include light chains or fragments thereof from IgG, IgM, IgD, IgE or IgA. Aspects of the invention correspond to proteins for modified or derived forms thereof, including whole antibody molecules and other antigen recognition molecule fragments such as, for example, Fab, single-chain Fv (scFv) and F (ab ') 2 It is about genes. Antibodies and fragments are animal-derived, human-mouse chimera, humanized, altered by Deimmunisation ™ (Biovation Ltd), altered to change affinity for Fc receptors, or complete It can be a person. Embodiments of ligand-binding molecules can mature affinity as understood in the art. In preferred embodiments, the antibody or other recombinant protein does not elicit or minimally elicit an immune response in the human or animal to which it is administered.

항체는 이특이적일 수 있으며 디안티보디(diantibody), 콰드로마(quadroma), 미니-항체, ScBs 항체 및 놉-인투-홀(knobs-into-holes) 항체를 포함하나, 이에 한정되지 않는다.Antibodies can be bispecific and include, but are not limited to, diantibody, quadroma, mini-antibodies, ScBs antibodies, and knobs-into-holes antibodies.

항체 자체의 생산 및 회수는 당해 분야에 잘 공지된 각종 방식으로 달성할 수 있다(참조: Harlow et al. 1988. Antibodies, A Laboratory Manual, Cold Spring Harbor Laboratory). 다른 목적 단백질을 수집하고/하거나 정제하고/하거나 당해 분야에 잘 공지된 방법에 따라 사용한다.Production and recovery of the antibody itself can be accomplished in a variety of ways well known in the art (Harlow et al. 1988. Antibodies, A Laboratory Manual, Cold Spring Harbor Laboratory). Other target proteins are collected and / or purified and / or used according to methods well known in the art.

본 발명의 양태를 실시하는데 있어서, 재조합체 DNA 기술을 사용한 항체 또는 이의 변이체(유사체)의 생산은 숙주 세포의 성장 및 암호화 서열의 발현에 적절한 배양 조건하에서 변형된 재조합체 숙주 세포를 배양함으로써 달성될 수 있다. 발현의 성공을 모니터링하기 위하여, ELISA, RIA 등과 같은 표준 기술을 사용하여 항원와 관련하여 항체의 농도를 모니터링할 수 있다. 항체는 당해 분야에 공지된 표준 기술을 사용하여 배양 상층액으로부터 회수한다. 이들 항체의 정제된 형태는 물론 단백질 A, 단백질 G 또는 단백질 L 컬럼을 통한, 또는 특수 항원과 관련하거나, 심지어 특이성이 요구되는 항원의 특수 에피토프도 관련한 친화성 크로마토그래피를 포함하나, 이에 한정되지 않는 표준 정제 기술에 의해 용이하게 제조할 수 있다. 항체는 또한 이온 교환, 소수성 상호작용, 친화성 또는 크기 배제 컬럼과 같은 통상의 크로마토그래피를 사용하여 당해 분야에서 이해되는 바와 같이 정제할 수 있다[참조: 정제 기술을 기재하고 있는 "Low pH hydrophobic interaction chromatography for antibody purification"이라는 명칭의 1997년 6월 24일 린데르크네흐(Rinderknecht) 등에 의한 미국 특허 제5,641,870호 및 "Process for purifying proteins in a hydrophobic interaction chromatography flow-through fraction"이라는 명칭의 2008년 9월 23일자의 슈클라(Shukla) 등에 의한 미국 특허 제7,427,659호]. 정제 기술은 황산암모늄 침전 및 크기-제한된 막 여과와 같은 다른 기술과 함께 또는 다양한 조합으로 수행할 수 있다. 발현 시스템이 시그날 펩타이드를 포함하도록 설계되는 경우, 수득되는 항체는 배양 배지 또는 상층액내로 분비되나; 세포내 생산이 또한 가능하다. 세포내 내용물은 회수하여 정제에 적용시킬 수 있다.In practicing embodiments of the present invention, the production of antibodies or variants thereof (analogues) using recombinant DNA technology can be achieved by culturing modified recombinant host cells under culture conditions appropriate for growth of the host cells and expression of coding sequences. Can be. To monitor the success of expression, standard techniques such as ELISA, RIA, and the like can be used to monitor the concentration of the antibody with respect to the antigen. Antibodies are recovered from the culture supernatant using standard techniques known in the art. Purified forms of these antibodies include, but are not limited to, affinity chromatography involving a Protein A, Protein G or Protein L column, or even specific epitopes of antigens associated with, or even requiring, specific antigens. It can be easily prepared by standard purification techniques. Antibodies can also be purified as understood in the art using conventional chromatography, such as ion exchange, hydrophobic interactions, affinity or size exclusion columns. See “Low pH hydrophobic interaction, which describes purification techniques. US Patent No. 5,641,870 to Rinderknecht et al. on June 24, 1997, entitled "chromatography for antibody purification," and September 2008, entitled "Process for purifying proteins in a hydrophobic interaction chromatography flow-through fraction." US Pat. No. 7,427,659 to Shukla et al. Purification techniques can be performed in combination with other techniques such as ammonium sulfate precipitation and size-limited membrane filtration or in various combinations. If the expression system is designed to include a signal peptide, the antibody obtained is secreted into the culture medium or supernatant; Intracellular production is also possible. Intracellular contents can be recovered and applied to the purification.

폴리프로테인의 프로세싱의 목적하는 수준, 예를 들면, 가장 완전한 프로세싱을 촉진하는 세포 배양 조건이 선택될 수 있다. 이러한 프로세싱은 세포내적으로 발생하지만, 또한 세포외적으로, 세포 배양 공정 동안 또는 후에 발생할 수 있다.The desired level of processing of the polyprotein, for example cell culture conditions that facilitate the most complete processing, can be selected. Such processing occurs intracellularly, but can also occur extracellularly during or after the cell culture process.

사람 Ig 유전자좌로 가공된 마우스로부터의 항원-특이적인, 완전한 사람 단클론 항체의 생산 및 선택은 이미 기술되어 왔다(참조: Jakobovits et al. 1998. Advanced Drug Delivery Reviews 31 :33-42; Mendez et al. 1997. Nature Genetics 15: 146-156; Jakobovits et al. 1995. Curr Opin Biotechnol 6: 561 -566; Green et al. 1994. Nature Genetics Vol. 7:13-21).Production and selection of antigen-specific, fully human monoclonal antibodies from mice processed with human Ig loci have already been described (Jakobovits et al. 1998. Advanced Drug Delivery Reviews 31: 33-42; Mendez et al. Nature Genetics 15: 146-156; Jakobovits et al. 1995. Curr Opin Biotechnol 6: 561-566; Green et al. 1994. Nature Genetics Vol. 7: 13-21).

치료용 단클론 항체의 고농도 발현은 유전자이식 염소의 젖에서 달성되어 왔으며, 항원 결합 수준이 통상의 세포 배양 기술을 사용하여 생산된 단클론 항체의 것과 동등함이 밝혀져 있다. 당해 방법은 유전 정보를 수반하여 자체의 젖에서 사람 치료용 단백질을 발현하도록 하는 유전자이식된 동물의 젖에서 사람 치료용 단백질의 개발에 기초한다. 일단 이들이 생산되면, 이들 재조합체 단백질은 표준 기술을 사용하여 젖으로부터 효과적으로 정제할 수 있다[참조: 예를 들면, Pollock et al. 1999. J. Immunol. Meth. 231 :147-157 및 Young et al. 1998. Res Immunol. 149(6): 609-610]. 유전자이식 동물로부터의 동물 젖, 달걀 흰자, 혈액, 뇨, 정액 혈장 및 누에 꼬치는 산업 규모에서 재조합체 단백질의 생산을 위한 공급원으로서 잠재성이 입증되어 왔다[참조: Houdebine L M. 2002. Curr Opin Biotechnol 13:625-629; Little et al. 2000. Immunol Today, 21(8):364-70; 및 Gura T. 2002. Nature, 417:584-5860]. 본 발명은 본 발명의 자가-프로세싱 절단 부위-암호화 및/또는 프로테아제 인식 부위 벡터를 사용하여 재조합체 항체 또는 변이체(유사체) 또는 이의 목적한 다른 단백질(들)의 발현을 위한 유전자이식 동물 발현 시스템의 사용을 고려한다.High concentration expression of therapeutic monoclonal antibodies has been achieved in the milk of transgenic goats, and it has been found that antigen binding levels are equivalent to those of monoclonal antibodies produced using conventional cell culture techniques. The method is based on the development of a human therapeutic protein in the milk of a transgenic animal that carries genetic information to express the human therapeutic protein in its own milk. Once they are produced, these recombinant proteins can be effectively purified from milk using standard techniques. See, eg, Pollock et al. 1999. J. Immunol. Meth. 231: 147-157 and Young et al. 1998. Res Immunol. 149 (6): 609-610]. Animal milk, egg whites, blood, urine, seminal plasma and silkworm skewers from transgenic animals have proven potential as sources for the production of recombinant proteins on an industrial scale. Houdebine L M. 2002. Curr Opin Biotechnol 13: 625-629; Little et al. 2000. Immunol Today, 21 (8): 364-70; And Gura T. 2002. Nature, 417: 584-5860. The present invention is directed to a transgenic animal expression system for the expression of recombinant antibodies or variants (analogs) or other protein (s) of interest using the self-processing cleavage site-encoding and / or protease recognition site vectors of the present invention. Consider using it.

아그로박테리움 감염, 바이오리스틱(biolistic) 형질전환, 원형질체 형질전환 등에 의해 형질전환된 감자, 토마토, 담배, 벼 및 다른 식물을 포함하나, 이에 한정되지 않는 식물에서 재조합체 단백질의 생산이 성공적으로 입증되어 왔다. 유전자이식 담배 식물의 종자에서 재조합체 사람 GM-CSF 발현, 및 식물에서 일본쇄 항체를 포함하는 항체의 발현이 입증되어 왔다[참조: 예를 들면, Streaffield and Howard. 2003. Int. J. Parasitol. 33:479-93; Schillberg et al. 2003. Cell Mol Life Sci. 60:433A5; Pogue et al. 2002. Annu. Rev. Phytopathol. 40:45-74; 및 McCormick et al. 2003. J Immunological Methods, 278:95-104]. 본 발명은 본 발명의 프로테아제 절단 부위 또는 자가-프로세싱 절단 부위-암호화 벡터를 사용하여 재조합체 면역글로불린 또는 이의 단편 또는 목적한 다른 단백질(들)의 발현을 위한 유전자이식 식물 발현 시스템의 사용을 고려한다.Successful production of recombinant proteins in plants including, but not limited to, potatoes, tomatoes, tobacco, rice, and other plants transformed by Agrobacterium infection, biolistic transformation, protoplast transformation, and the like Has been. Expression of recombinant human GM-CSF in seeds of transgenic tobacco plants, and expression of antibodies comprising Japanese chain antibodies in plants has been demonstrated. See, eg, Streaffield and Howard. 2003. Int. J. Parasitol. 33: 479-93; Schillberg et al. 2003. Cell Mol Life Sci. 60: 433A5; Pogue et al. 2002. Annu. Rev. Phytopathol. 40: 45-74; And McCormick et al. 2003. J Immunological Methods, 278: 95-104. The present invention contemplates the use of a transgenic plant expression system for the expression of recombinant immunoglobulins or fragments thereof or other protein (s) of interest using the protease cleavage site or self-processing cleavage site-encoding vector of the invention. .

곤충 세포와 관련하여 바큘로바이러스 벡터 발현 시스템이 또한 재조합체 단백질 생산을 위해 실행가능한 플랫폼(platform)으로서 시도되고 있다. 바큘로바이러스 벡터 발현 시스템은 배양 용이성 및 보다 높은 발현 수준과 같은 포유동물 세포 배양과 관련한 장점을 제공하는 것으로 보고되어 왔다(참조: 예를 들면, Ghosh et al. 2002. Mol Ther. 6:5-11, 및 Ikonomou et al. 2003. Appl Microbiol Biotechnol. 62:1-20). 본 발명은 또한 본 발명의 자가-프로세싱 절단 부위-암호화 벡터를 사용한 재조합체 면역글로불린 또는 이의 단편의 발현을 위한 바큘로바이러스 벡터 발현 시스템의 용도를 고려한다. 바큘로바이러스 벡터 및 적합한 숙주 세포는 당해 분야에 잘 공지되어 있으며 시판되고 있다.In the context of insect cells, baculovirus vector expression systems have also been attempted as viable platforms for recombinant protein production. Baculovirus vector expression systems have been reported to provide advantages with respect to mammalian cell culture, such as ease of culture and higher expression levels (see, eg, Ghosh et al. 2002. Mol Ther. 6: 5- 11, and Ikonomou et al. 2003. Appl Microbiol Biotechnol. 62: 1-20). The present invention also contemplates the use of baculovirus vector expression systems for the expression of recombinant immunoglobulins or fragments thereof using the self-processing cleavage site-encoding vectors of the invention. Baculovirus vectors and suitable host cells are well known in the art and commercially available.

효모-계 시스템 또한 본 발명의 자가-프로세싱 절단 부위-암호화 벡터를 사용하여 2개- 또는 3개-하이브리드 시스템을 포함하는, 재조합체 면역글로불린 또는 이의 단편 또는 목적한 다른 단백질(들)의 발현을 위해 사용될 수 있다(참조: 예를 들면, 본원에 참조로 인용된 미국 특허 제5,643,745호).Yeast-based systems also express expression of recombinant immunoglobulins or fragments thereof or other protein (s) of interest, including two- or three-hybrid systems using the self-processing cleavage site-encoding vectors of the present invention. (See, eg, US Pat. No. 5,643,745, incorporated herein by reference).

자가-프로세싱 펩타이드에 대한 암호화 서열을 단독으로 또는 단백질분해 절단 부위에 대한 추가의 암호화 서열과 함께 포함하는 본 발명의 발현 카세트 및 벡터 및 재조합체 숙주 세포는, 이의 다수가 당해 분야에 공지되어 있고 이의 예들이 본원에 기술되어 있는, 어떠한 단백질 발현 시스템에서 2개- 및 3개-하이브리드 시스템의 단백질 성분, 생물학적으로 활성인 단백질, 프로단백질 및 재조합체 면역글로불린 또는 이의 단편의 발현에 있어서의 유용성이 발견된다. 당해 분야의 숙련가는 어떠한 단백질 발현 시스템에서도 사용하기 위한 본 발명의 벡터, 숙주 세포 및 방법의 양태들을 용이하게 조정할 수 있다.
Expression cassettes and vectors and recombinant host cells of the present invention comprising coding sequences for self-processing peptides alone or with additional coding sequences for proteolytic cleavage sites, many of which are known in the art and Examples of usefulness in the expression of protein components, biologically active proteins, proproteins and recombinant immunoglobulins or fragments thereof, of two- and three-hybrid systems in any protein expression system described herein are found. do. One skilled in the art can readily adapt aspects of the vectors, host cells, and methods of the invention for use in any protein expression system.

실시예 1. Lon 프로테아제 인테인 및 발현 작제물Example 1.Lon Protease Inteins and Expression Constructs

3개의 ATP-의존성 Lon 프로테아제 인테인은 뉴 잉글란드 바이오랩스(New England Biolabs)(NEB, 미국 매사추세츠주 입스위치 소재) 인테인 데이타베이스(InBase, The Intein Database and Registry; at http://www.neb.com/neb/Inteins.html)에 보고되어 있다[참조: Perler, F. B. (2002). InBase, the Intein Database. Nucleic Acids Res. 30, 383-384]. 이들 인테인은 유기체 파리로코쿠스 아비씨(Pab Lon Intein), 파이로코쿠스 푸리오수스(Pfu Lon Intein) 및 파이로코쿠스 호리코시이 OT3(Pho Lon Intein)으로부터 기원했다. 이들 Lon 인테인은 제안된 엔도뉴클레아제 도메인, 인테인의 끝에서 두번째 잔기로서 히스티딘 대신 리신, 및 상이한 길이(각각 333, 401, 및 474개 아미노산)을 갖는다. NEB 데이타베이스에서, 모든 3개의 lon 인테인은 이론적 인테인으로 나타나 있으며, 이는, 데이타 베이스에 따라서 목록 기여자가 스플라이싱된 생성물의 존재가 제공된 인테인 도입에 대해 입증되지 않았음을 나타낸다. Pab Lon 인테인의 엔도뉴클레아제 도메인은 실험적으로 활성을 갖지 않는 것으로 밝혀졌다[참조: Saves I, Morlot C, Thion L, Rolland JL, Dietrich J, Masson JM. Investigating the endonuclease activity of four Pyrococcus abyssi Inteins. Nucleic Acids Res. 2002 Oct 1 ;30(19):4158-65].The three ATP-dependent Lon protease inteins are found in the New England Biolabs (NEB, Ipswich, Mass., USA) in the Intein Database and Registry; at http: // www. neb.com/neb/Inteins.html), Perler, FB (2002). InBase, the Intein Database. Nucleic Acids Res. 30, 383-384. These inteins originated from the organisms Pabi Lon Intein, Pyrococcus Prio Lon Intein and Pyrococcus horicosy OT3 (Pho Lon Intein). These Lon inteins have a proposed endonuclease domain, lysine instead of histidine as the second residue at the end of the intein, and different lengths (333, 401, and 474 amino acids, respectively). In the NEB database, all three lon inteins are shown as theoretical inteins, indicating that, according to the database, the presence of spliced products by the list contributors has not been demonstrated for the intein introduction provided. The endonuclease domain of the Pab Lon intein has been found to be experimentally inactive (see Saves I, Morlot C, Thion L, Rolland JL, Dietrich J, Masson JM. Investigating the endonuclease activity of four Pyrococcus abyssi Inteins. Nucleic Acids Res. 2002 Oct 1; 30 (19): 4158-65.

본 발명자들은, 유전자들의 ATP-의존성 프로테아제 lon 계열에 함유된 인테인이 각종의 단일의 전사 해독 프레임 작제물 설계에 있어서 항체 중쇄 및 경쇄의 절단을 매개하는데 있어 매우 효과적임을 발견하였다. 이들 인테인과 관련된 서열 정보는 본원에서 제공된다.We have found that the inteins contained in the ATP-dependent protease lon family of genes are very effective in mediating cleavage of antibody heavy and light chains in the design of a variety of single transcription translation frame constructs. Sequence information related to these inteins is provided herein.

Lon 인테인 서열 및 벡터 작제물 설계Lon intein sequence and vector construct design

표 1은 -1 및 +1 엑스테인 잔기를 포함하는, NCBI/단백질, PAB1313 Pab Lon 인테인에서 Pab Lon 인테인, 수탁 번호 제CAB50486.1호에 대한 단백질 서열 정보를 제공한다(서열 번호 1).Table 1 provides protein sequence information for the Pab Lon intein, Accession No. CAB50486.1 from the NCBI / protein, PAB1313 Pab Lon intein, including the −1 and +1 extein residues (SEQ ID NO: 1) .

Figure pct00001
Figure pct00001

표 2는 코돈 용도를 위해 최적화된 Pab Lon 인테인에 대한 뉴클레오타이드 서열을 기술한다.Table 2 describes the nucleotide sequences for the Pab Lon intein optimized for codon use.

Figure pct00002
Figure pct00002

표 3은 서열 번호 2에 의해 암호화된 단백질 서열, 서열 번호 3을 기술한다.Table 3 describes the protein sequence encoded by SEQ ID NO: 2, SEQ ID NO: 3.

Figure pct00003
Figure pct00003

표 4는 -1 및 +1 엑스테인 잔기를 포함하는, NCBI/단백질, PF0467내 Pfu Lon 인테인, 수탁 번호 제AAL80591.1호에 대한 단백질 서열 정보를 제공한다(서열 번호 4).Table 4 provides protein sequence information for the NCBI / protein, Pfu Lon intein in PF0467, Accession No. AAL80591.1, including the −1 and +1 extein residues (SEQ ID NO: 4).

Figure pct00004
Figure pct00004

표 5는 천연의 Pfu Lon 인테인에 대한 뉴클레오타이드 서열 정보를 제공한다(서열 번호 5).Table 5 provides nucleotide sequence information for the native Pfu Lon intein (SEQ ID NO: 5).

Figure pct00005
Figure pct00005

표 6은 서열 번호 5에 의해 암호화된 단백질 서열, 서열 번호 6을 기술한다.Table 6 describes the protein sequence encoded by SEQ ID NO: 5, SEQ ID NO: 6.

Figure pct00006
Figure pct00006

Pfu Lon 인테인을 PCR 기술을 사용하여 클로닝하였다. Pab Lon 인테인 뉴클레오타이드 서열을 포유동물 코돈 용도에 따라 설계하여 합성하였다. 파이로코쿠스 아비시이 lon 프로테아제 인테인의 단백질 서열은 매사추세츠주 입스위치 소재의 뉴 잉글란드 바이오랩스(http://www.neb.com/neb/Inteins.html)에 의해 후원된 공공에게 맡겨진 인테인의 데이타베이스인, Inbase로부터 수득되었다. 수득된 단백질 서열은 EMBL 수탁 번호 CAB50486.1, gi5459000로서 나열되어 있으나; 웹 사이트에 나열된 단백질 서열을 사용하였다. Pab-lon 인테인 단백질 서열은 표 7에 나타낸다.Pfu Lon inteins were cloned using PCR techniques. Pab Lon intetan nucleotide sequences were designed and synthesized according to mammalian codon usage. The protein sequence of the Pyrococcus abisii lon protease intein is publicly entrusted intein sponsored by New England Biolabs, Ipswich, Massachusetts (http://www.neb.com/neb/Inteins.html) Obtained from Inbase, which is a database of. The protein sequence obtained is listed as EMBL Accession No. CAB50486.1, gi5459000; The protein sequences listed on the website were used. Pab-lon intein protein sequences are shown in Table 7.

Figure pct00007
Figure pct00007

당해 Pab-lon 단백질 서열을 GeneArt[제조원: 겐아트 아게(GeneArt AG), 독일 레겐스부르크 소재]에 의해 포유동물 발현을 위해 최적화된 DNA 서열로 등록된 방법을 사용하여 역-해독하였다. 수득되는 Pab-lon 인테인 DNA 서열은 표 8에 나타낸다. DNA 작제물은 특수한 클로닝 및 발현 벡터의 선택 및 통상의 기술을 사용한 상응하는 분자 생물학 시도에 의존하여 추가의 플랭킹 조정인자를 임의로 제공할 수 있다. DNA 서열을 999bp 단편으로서 합성하고(참조: GeneArt Synthesis Number 0611467) GeneArt 벡터 플라스미드, pGA4내로 전달하였다(참조: Part:BBa_J70003을 포함하는, the Registry of Biological Standard Parts at http://partsregistry.org). 제공받은 DNA 물질을 재서열분석하고 설계된 서열에 상응하는지를 측정하였다. 당해 DNA 물질을 후속적인 Pab-lon 인테인 함유 플라스미드 작제물에 대한 공급원/주형으로서 직접 사용하였으며; 플라스미드는 재증식되지 않았다.The Pab-lon protein sequence was back-decoded using a method registered by GeneArt (GeneArt AG, Regensburg, Germany) with a DNA sequence optimized for mammalian expression. The Pab-lon intein DNA sequences obtained are shown in Table 8. DNA constructs may optionally provide additional flanking modulators depending on the selection of specific cloning and expression vectors and the corresponding molecular biology attempts using conventional techniques. DNA sequences were synthesized as 999 bp fragments (GeneArt Synthesis Number 0611467) and transferred into the GeneArt vector plasmid, pGA4 (see: The Registry of Biological Standard Parts at http://partsregistry.org, including Part: BBA_J70003). The provided DNA material was resequenced and determined to correspond to the designed sequence. This DNA material was used directly as a source / template for subsequent Pab-lon intein containing plasmid constructs; The plasmid did not reproliferate.

Figure pct00008
Figure pct00008

다음 포유동물 발현 벡터를 작제하였다: pTT3-pfu lon HL(+), pTT3-pfu lon HL(-), pTT3-pfu lon LH(+), pTT3-pfu lon LH(-), pTT3-pfu lon LKH(+), pTT3-pfu lon LKH(-), pTT3-pab lon HL(+), pTT3 pab lon HL (-), pTT3- pab lon LH (+), pTT3- pab lon LH(-), pTT3- pab lon LKH(+), pTT3- pab lon LKH(-). 여기서, H 및 L 성분들은 D2E7로 설계된 항체에 대한 면역글로불린 중쇄 및 경쇄를 나타낸다. pTT3 pab lon HL(-) 작제물을 개략적으로 나타내기 위해, 도 1을 참조한다. 도 2는 D2E7 항체를 발현할 수 있는 이들 일시적인 발현 벡터의 sORF 성분들에 대한 구조들의 국면을 도시한다.The following mammalian expression vectors were constructed: pTT3-pfu lon HL (+), pTT3-pfu lon HL (-), pTT3-pfu lon LH (+), pTT3-pfu lon LH (-), pTT3-pfu lon LKH (+), pTT3-pfu lon LKH (-), pTT3-pab lon HL (+), pTT3 pab lon HL (-), pTT3-pab lon LH (+), pTT3-pab lon LH (-), pTT3- pab lon LKH (+), pTT3-pab lon LKH (-). Here, the H and L components represent immunoglobulin heavy and light chains for antibodies designed with D2E7. For a schematic representation of the pTT3 pablon HL (−) construct, reference is made to FIG. 1. FIG. 2 shows aspects of the structures for the sORF components of these transient expression vectors capable of expressing D2E7 antibodies.

비록 pTT3 벡터가 특수 양태를 나타낸다고 해도, 추가의 양태들은 본원에 기재된 하나 이상의 단백질을 암호화하는 분리된 핵산에 관한 국면을 포함할 수 있다. 추가의 양태는 분리된 핵산 서열을 포함하는 벡터를 제공하며, 여기서 상기 벡터는 pcDNA; pTT(참조: Durocher et al., Nucleic Acids Research 2002, Vol 30, No.2:E9); pTT3; pEFBOS (Mizushima, S. and Nagata, S., 1990, Nucleic Acids Research Vol 18, No. 17:5322); pBV; pJV; 및 pBJ로 이루어진 그룹에서 선택된다. 상기 주목한 바와 같이, 각종의 작제물이 pTT3 벡터 골격에서 이루어졌다. 당해 벡터는 EBV 복제 오리진을 가지며, 이는 현탁 배양물 속에서 형질감염된 293E 세포(이는 엡슈타인-바르 바이러스 핵 항원 1을 발현한다)에서 이의 에피솜 증폭을 허용한다(참조: 벡터 pTT를 기술하는 Durocher et al.). pTT와 관련하여, pTT3은 2005년 7월 7일자의 가유르(Ghayur), 타리크(Tariq) 등에 의한 미국 특허원 공보 제20050147610호에 나타낸 바와 같은 추가의 다수 클로닝 부위를 갖는다.Although the pTT3 vector represents a particular embodiment, additional embodiments may include aspects of an isolated nucleic acid encoding one or more proteins described herein. A further aspect provides a vector comprising an isolated nucleic acid sequence, wherein the vector is pcDNA; pTT (Durocher et al., Nucleic Acids Research 2002, Vol 30, No. 2: E9); pTT3; pEFBOS (Mizushima, S. and Nagata, S., 1990, Nucleic Acids Research Vol 18, No. 17: 5322); pBV; pJV; And pBJ. As noted above, various constructs were made in the pTT3 vector backbone. The vector has an EBV replication origin, which allows for its episomal amplification in 293E cells (which express Epstein-Barr virus nuclear antigen 1) transfected in suspension culture (see Durocher describing vector pTT). et al.). With respect to pTT, pTT3 has an additional multiple cloning site as shown in US Patent Application Publication No. 20050147610 by Ghayur, Tariq et al. on July 7, 2005.

각각의 pTT3-계 벡터는 CMV 프로모터에 의해 조절된 1개의 ORF를 가졌다. ORF에서, 인테인 서열은 HC-인테인-LC 또는 LC-인테인-HC의 순서로 항체 중쇄와 경쇄(각각 HC 및 LC, 또는 단순히 H 및 L) 사이의 프레임내에 삽입되었다. "HL" 명칭을 갖는 작제물은 항체 HC 암호화 서열에 이어 인테인 및 이후 LC 암호화 서열을 가지며; "LH" 명칭을 가진 작제물은 LC 암호화 서열에 이어 인테인 및 이후 HC 암호화 서열을 갖는다. "LKH" 명칭을 가진 작제물은 LC와 인테인 사이에 삽입된 리신(K)을 갖는다. "(-)" 명칭을 갖는 작제물은 ORF의 개시부에서 1개의 시그날 펩타이드 및 인테인의 마지막 아미노산과 인테인을 따라가는 성숙한 항체 중쇄 또는 경쇄의 첫번째 아미노산 사이에 삽입된 메티오닌을 갖는다. "(+)" 명칭을 갖는 작제물은 ORF의 개시부에서 1개의 시그날 펩타이드 및 인테인의 하부의 항체 소단위의 개시부에서 제2의 시그날 펩타이드를 갖는다.Each pTT3-based vector had one ORF regulated by the CMV promoter. In ORF, the intein sequence was inserted in the frame between the antibody heavy and light chains (HC and LC, or simply H and L, respectively) in the order of HC-intein-LC or LC-intein-HC. Constructs with the name "HL" have an antibody HC coding sequence followed by an intein followed by an LC coding sequence; Constructs with the name “LH” have an LC coding sequence followed by an intein and then an HC coding sequence. Constructs with the name “LKH” have lysine (K) inserted between the LC and the intein. The construct with the name “(−)” has methionine inserted between one signal peptide and the last amino acid of the intein and the first amino acid of the mature antibody heavy or light chain following the intein at the beginning of the ORF. Constructs with the name “(+)” have one signal peptide at the beginning of the ORF and a second signal peptide at the beginning of the antibody subunits below the intein.

작제물은 일시적인 형질감염을 통해 293E 세포내로 도입되었다. 요약하면, 복합체를 ORF 작제물 및 폴리에틸렌이민(PEI)을 암호화하는 pTT3 벡터를 사용하여 제조하였다. PEI-DNA 복합체를 사용하여 HEK293E 세포를 형질감염시켰다(참조: Durocher et al., 2002, Nucl. Acids Res. 30:E9). 세포 및 배양 상층액을 분석을 위한 형질감염 후 4 내지 7일째에 수집하였다.The construct was introduced into 293E cells via transient transfection. In summary, the complex was prepared using an ORF construct and a pTT3 vector encoding polyethyleneimine (PEI). PEI-DNA complexes were used to transfect HEK293E cells (Durocher et al., 2002, Nucl. Acids Res. 30: E9). Cells and culture supernatants were collected 4-7 days after transfection for analysis.

작제물에 의한 단백질 발현. 다수의 일시적인 발현 실험에서, 배양 상층액 시료를 형질감염 후 7일 또는 8일째에 수집하였다. 시료를 ELISA로 평가했고 하기 나타낸 바와 같이 IgG의 측정으로부터 분비된 항체의 농도 또는 범위를 함유하였다. Protein Expression by Constructs. In many transient expression experiments, culture supernatant samples were collected 7 or 8 days after transfection. Samples were evaluated by ELISA and contained concentrations or ranges of antibodies secreted from the measurement of IgG as shown below.

Figure pct00009
Figure pct00009

상기 기술한 작제물 시리즈와 동일한 항체를 발현하고, 동일한 조절 성분들을 사용하는 통상의 2개-벡터 시스템을 대조군으로서 당해 실험에 포함시켰다(참조: 표, 하부 열). 따라서, 대조군 벡터는 2개의 별개의 pTT3 벡터내에 운반된 2개의 별개의 ORF로부터의 항체 중쇄 및 경쇄를 도입하는 통상의 시도를 사용하여 D2E7 항체를 발현하였다. 당해 대조군 벡터 시스템으로부터 생산된 항체 분비 농도는 표에 나타낸 바와 같이 10 내지 60 μg/ml의 범위이었다.A conventional two-vector system expressing the same antibody as the series of constructs described above and using the same regulatory components was included in the experiment as a control (Table, bottom column). Thus, the control vector expressed the D2E7 antibody using conventional attempts to introduce antibody heavy and light chains from two separate ORFs carried in two separate pTT3 vectors. The antibody secretion concentrations produced from this control vector system ranged from 10 to 60 μg / ml as shown in the table.

Lon 인테인을 사용하는 수개의 sORF 작제물 설계에 의해 생산된 IgG 분비 농도는 통상의 대조군 벡터를 사용하여 생산된 것과 비교하여 동일한 범위, 또는 그 이상의 범위이다. 당해 농도는 포유동물 세포내에서 1.6㎍/ml인 것으로 보고된 "2A" 기술을 사용하여 생산된 것들보다 유의적으로 더 높다(참조: Fang et al., 2005, Nature Biotechnology 23:584-590). 비록 Pab Lon 및 Pfu Lon 인테인 둘다가 작제물 설계에 사용되어 바람직한 농도의 항체 생산을 수득한다고 해도, 기술된 pTT3 작제물내 Pab Lon 인테인은 보다 높은 농도의 항체 분비를 허용하였다. 이들 데이타는 또한, 항체 분비 농도가 일반적으로, LH 작제물 설계가 사용된 경우보다 HL 작제물 설계가 사용된 경우 더 높음을 제안한다. 면역글로불린 쇄의 순서의 특징 및 시그날 서열의 국면을 결합함으로써, HL(-) 작제물은 연구된 것들 중에서 분비된 항체 생성물의 최대 농도를 생성할 수 있었다.IgG secretion concentrations produced by several sORF construct designs using Lon intein are in the same range, or more, compared to those produced using conventional control vectors. This concentration is significantly higher than those produced using the "2A" technique reported to be 1.6 μg / ml in mammalian cells (Fang et al., 2005, Nature Biotechnology 23: 584-590). . Although both Pab Lon and Pfu Lon inteins were used in construct design to obtain the desired concentration of antibody production, the Pab Lon intein in the described pTT3 constructs allowed for higher concentrations of antibody secretion. These data also suggest that antibody secretion concentrations are generally higher when the HL construct design is used than when the LH construct design is used. By combining features of the sequence of the immunoglobulin chains and aspects of the signal sequence, the HL (−) construct was able to produce the maximum concentration of secreted antibody product among those studied.

발현 생성물의 추가의 특성화Further Characterization of Expression Products

표 9에 나열된 특정의 sORF 작제물을 발현 생성물의 분석을 포함하는 발현 국면에 관하여 추가로 특성화하였다. 이들 작제물은 비교적 높은 수준의 분비된 항체를 생산한 4개의 예들을 포함하였다: pTT3 pfu lon HL (-), pTT3 pfu lon HL (+), pTT3 pfu lon LKH (-), 및 pTT3 pab lon HL (-). 이들 작제물로부터 생산된 분비된 항체는 단백질 A 친화성 크로마토그래피로 정제하고 환원 및 비-환원 SDS-PAGE 겔 둘다에서 분석하고, 이들의 HL 및 LC에 대한 N-말단 아미노산 서열들을 측정하였다.Certain sORF constructs listed in Table 9 were further characterized in terms of expression phases, including analysis of expression products. These constructs included four examples that produced relatively high levels of secreted antibodies: pTT3 pfu lon HL (-), pTT3 pfu lon HL (+), pTT3 pfu lon LKH (-), and pTT3 pab lon HL (-). Secreted antibodies produced from these constructs were purified by Protein A affinity chromatography and analyzed on both reducing and non-reducing SDS-PAGE gels and the N-terminal amino acid sequences for their HL and LC were determined.

pTT3 pfu lon HL (-)를 사용하여 생산된 시료는, 상기 기술한 대조군 D2E7 벡터와 같은 통상의 벡터를 사용한 전통적인 방법에 의해 생산된 항체로부터 구별가능한 이동과 함께, 항체 HC, 항체 LC, 및 완전히 조립된 항체(비-환원 겔 상에서)에 상응하는 겔 이동 밴드를 함유하였다. 환원 겔 상에서, 항체 HC 및 LC에 상응하는 밴드 외에, 프로세싱되지 않은 3부 단백질(HC-인테인-LC) 및 부분적으로 프로세싱된 HC-인테인 융합체에 상응하는 것으로 나타난 2개의 고 분자량(MW) 밴드가 또한 존재한다. 당해 평가는 웨스턴 블롯 분석(western blot analysis) 및 질량 분광법 분석을 기초로 했다. 이들 2개 밴드의 풍부성은 배양 조건을 변형시킴으로써 감소시킬 수 있고 배양 조건에 의존적인 것으로 여겨졌다. 이들 고 MW 생성물은 본원에 제공되고/되거나 당해 분야에서 이해되는 바와 같은 다른 설명에 따른 방법을 사용하여 완전히 프로세싱된 항체 약물 물질로부터 편리하게 제거될 수 있다.Samples produced using pTT3 pfu lon HL (-), antibody HC, antibody LC, and fully, with distinguishable migration from antibodies produced by conventional methods using conventional vectors such as the control D2E7 vector described above Gel transfer bands corresponding to the assembled antibody (on the non-reducing gel) were contained. On the reducing gel, in addition to the bands corresponding to the antibodies HC and LC, two high molecular weights (MW) which appeared to correspond to unprocessed 3-part protein (HC-intein-LC) and partially processed HC-intein fusions There is also a band. This evaluation was based on western blot analysis and mass spectrometry analysis. The abundance of these two bands can be reduced by modifying the culture conditions and was believed to be dependent on the culture conditions. These high MW products can be conveniently removed from the fully processed antibody drug substance using methods according to other descriptions provided herein and / or as understood in the art.

pTT3 pfu lon HL (+)를 사용하여 생산된 시료는 전통적인 방법에 의해 생산된 항체로부터 구별할 수 없는 이동과 함께, 항체 HC, 항체 LC, 및 완전한 항체(비-환원 겔 상에서)에 상응하는 밴드를 함유하였다. 또한, 3부 폴리프로테인에 상응하는 하나의 더 큰 MW 밴드가 존재하였다. pTT3 pfu lon LKH(-)을 사용하여 생산된 시료는 또한 통상의 벡터를 사용하여 생산된 항체로부터 구별할 수 없는 이동과 함께 HC, LC, 및 완전한 항체(비-환원 겔 상에서)에 상응하는 밴드를 함유하였다. 환원 겔 상에서, HC 및 LC에 상응하는 밴드 외에, 2개의 더 높은 MW 밴드가 또한 존재하였다. 이들 중 처음 1개는 다른 벡터 설계에 대해 위에서 기술한 바와 같이, 3부 다중 단백질에 상응하였고; 제2 밴드는 LC-인테인 융합 생성물에 상응하였으며 당해 연결부에서 불완전한 절단으로 생성되었다. 생성물의 상대적인 풍부성 측면에서, 절단된 LC와 같이 많은 LC-인테인 융합체가 존재하는 것으로 여겨졌다.Samples produced using pTT3 pfu lon HL (+) bands corresponding to antibody HC, antibody LC, and complete antibody (on non-reducing gel), with indistinguishable migration from antibodies produced by conventional methods It contained. In addition, there was one larger MW band corresponding to the 3-part polyprotein. Samples produced using pTT3 pfu lon LKH (-) also correspond to HC, LC, and complete antibodies (on non-reducing gels) with indistinguishable migration from antibodies produced using conventional vectors. It contained. On the reducing gel, in addition to the bands corresponding to HC and LC, there were also two higher MW bands. The first of these corresponded to a three part multiple protein, as described above for other vector designs; The second band corresponded to the LC-intein fusion product and resulted from incomplete cleavage at this junction. In terms of the relative abundance of the product, it was believed that many LC-intein fusions exist, such as truncated LCs.

pTT3 pab lon HL (-)를 사용하여 생산된 시료는 전통적인 방법에 의해 생산된 항체로부터 구별할 수 없는 이동과 함께 HC, LC, 및 완전한 항체(비-환원 겔 상에서)에 상응하는 밴드를 함유하였다. 환원 겔상에서, HC 및 LC에 상응하는 밴드외에, 웨스턴 블롯 분석을 기초로 프로세싱되지 않은 3부 단백질에 상응하는 것으로 여겨지는 1개의 주요 더 높은 MW 밴드가 존재하였다. pTT3 pfu lon HL(-)을 사용하여 생산된 시료와 비교하여, 비교적 보다 적은 양의 당해 3부 더 높은 MW 밴드가 존재하였다. 당해 결과는, 심지어 Pfu lon 인테인 및 Pab lon 인테인이 동종이고 본 연구자의 벡터 설계에서 기능적으로 유사하다고 해도, Pab lon 매개된 N-말단 절단은 Pab lon 작제물로부터의 발현 이후 관측된 HC-인테인 융합체가 거의 존재하지 않으므로, Pfu lon에 의해 매개된 것 보다 더 완전함을 제안한다. 그러나, 작제물 둘다는 완전히 조립된 항체 생성물을 수득할 수 있음에 주목한다.Samples produced using pTT3 pablon HL (-) contained bands corresponding to HC, LC, and complete antibodies (on non-reducing gels) with indistinguishable migration from antibodies produced by conventional methods. . On the reducing gel, in addition to the bands corresponding to HC and LC, there was one major higher MW band that was considered to correspond to the unprocessed 3-part protein based on Western blot analysis. In comparison to samples produced using pTT3 pfu lon HL (−), there was a relatively smaller amount of this 3-part higher MW band. The results indicate that even if the Pfu lon intein and Pab lon intein are homogeneous and functionally similar in our vector design, Pab lon mediated N-terminal cleavage was observed after HC- expression observed from the Pab lon construct. Since little intein fusion is present, it is suggested that it is more complete than that mediated by Pfu lon. However, it is noted that both constructs can yield fully assembled antibody products.

한편, 프로세싱되지 않은 단백질 및 부분적으로 프로세싱된 단백질과 같은 특정 단백질 생산량은 완전히 프로세싱된 및 완전히 자가-조립된 항체 생성물과 같은 다른 작제물 생산량과 비교하여 오염된 생성물인 것으로 고려될 수 있다. 다른 한편, 이러한 특정의 단백질 생산량은, 예를 들면, 아직 완전한 항체 생성물을 생성할 수 없는 추가의 프로세싱 반응 및/또는 지향된 조립용 물질에 유용할 수 있다. 이들 단백질 생성량이 오염된 부산물로서 관찰되는 경우, 주목한 바와 같이 제거가 용이하게 하여 완전한 항체와 같은 목적하는 성분을 농축시키거나 정제하기 위한 선택 및 시도들이 존재한다.On the other hand, certain protein yields, such as unprocessed and partially processed proteins, can be considered to be contaminated products compared to other construct yields, such as fully processed and fully self-assembled antibody products. On the other hand, this particular protein yield may be useful, for example, for further processing reactions and / or directed assembly materials that are not yet able to produce a complete antibody product. If these protein productions are observed as contaminated by-products, there are choices and attempts to facilitate removal, as noted, to concentrate or purify the desired component, such as a complete antibody.

각종 작제물 발현 시스템으로부터 배양물 상층액의 세포외 시료 외에, 세포내 시료를 또한 수득하고 HC 및 LC 둘다에 대해 특이성을 갖는 검출 항체를 사용한 웨스턴 블롯 분석으로 분석하였다. 유사한 단백질 종을 배양된 상층액 시료 속에서 이들 종에 대해 기술된 바와 같이 관측하였다.In addition to extracellular samples of culture supernatants from various construct expression systems, intracellular samples were also obtained and analyzed by Western blot analysis using detection antibodies with specificity for both HC and LC. Similar protein species were observed as described for these species in cultured supernatant samples.

각종의 작제물의 중쇄 및 경쇄 둘다의 N-말단 아미노산 서열을 측정하였다(참조: 하기 표). 당해 결과는, 인테인-매개된 단백질 절단이 2개의 스플라이싱 연결부, 즉, HC와 인테인 성분들의 연결부 및 LC와 인테인 성분들의 연결부에서 정밀하게 일어남을 나타내었다.The N-terminal amino acid sequences of both the heavy and light chains of the various constructs were measured (see Table below). The results indicated that intein-mediated protein cleavage occurred precisely at two splicing connections, namely the linkage of HC and intein components and the linkage of LC and intein components.

Figure pct00010
Figure pct00010

LonLon 인테인Intaine 작제물로부터From the construct IgG1IgG1 항체의 기능적 특성 Functional Properties of Antibodies

표 9의 sORF 작제물 설계로부터 분비된 D2E7 항체 생성물을 또한 항원-특이적인 ELISA로 분석하였다. 분석 결과는, 작제물 항체 생성물이 D2E7 항체의 리간드인, 사람 TNF알파에 결합함을 입증하였다. 따라서, 인테인-계 작제물 및 발현 시스템은 기능적이고 항원-특이적인 완전한 자가-조립된 다합체성 항체를 수득하는 sORF 생성물을 발현하고 생성할 수 있다.The D2E7 antibody product secreted from the sORF construct design of Table 9 was also analyzed by antigen-specific ELISA. The analysis demonstrated that the construct antibody product binds to human TNFalpha, the ligand of the D2E7 antibody. Thus, intein-based constructs and expression systems are capable of expressing and producing sORF products that yield functional and antigen-specific, fully self-assembled multimeric antibodies.

pTT3 pfu lon HL(-) 작제물을 사용하여 생산된 항체를 단백질 A 친화성 정제에 이은 SEC, 크기 배제 크로마토그래피로 정제하였다. 정제된 항체를 BiaCore™ 시스템을 사용하는 표면 플라스몬 공명 기술로 분석하였다. sORF 작제물 생성량의 특징은 관련 리간드, TNFα에 대한 이의 결합 국면을 포함하였다. 표 11에서, 값들의 결과는 결합 속도 상수(ka, 1/Ms의 단위); 해리 속도 상수(kd, 1/s의 단위), 및 평형 해리 상수(KD, M의 단위)의 역학적 매개변수에 관한 BiaCore 분석으로부터 나타낸다. 해리 상수 값(KD)은 편리한 벡터(2개의 명백한 면역글로불린 쇄 sORF를 지닌)를 사용하여 생산된 아달리무마브(adalimumab)(D2E7) 항체의 것과 유사한 것으로 이해된다.Antibodies produced using the pTT3 pfu lon HL (−) construct were purified by Protein A affinity purification followed by SEC, size exclusion chromatography. Purified antibodies were analyzed by surface plasmon resonance technology using the BiaCore ™ system. Characterization of the amount of sORF construct production involved its binding aspect to the related ligand, TNFα. In Table 11, the result of the values is the binding rate constant (ka, units of 1 / Ms); From BiaCore analysis on the mechanical parameters of dissociation rate constants (kd, units of 1 / s), and equilibrium dissociation constants (units of KD, M). Dissociation constant values (KD) are understood to be similar to those of adalimumumab (D2E7) antibodies produced using a convenient vector (with two distinct immunoglobulin chain sORFs).

Figure pct00011
Figure pct00011

실시예Example 2.  2. 경쇄Light chain 서열의 변형된 항체를 생산하는  To produce a modified antibody of the sequence sORFsORF 작제물Construct

수개의 sORF 작제물을 D2E7의 면역글로불린 경쇄로부터의 변이인 경쇄 서열로 생성시켰다. 이들 sORF 작제물을 D2E7에서와 같이 또한 중쇄로 가공함으로써 IgG1 항체 물질을 생성할 수 있었다. 골격으로서 작제물 pTT3 pfu lon HL (-) 및 pTT3 pab lon HL (-)을 사용하여, 본 발명자들은 C-말단 스플라이싱 연결부, 즉, 인테인과 하부 면역글로불린 경쇄 성분 사이의 연결부에서 서열 변이를 갖는 작제물을 생성시키고 시험하였다(참조: 표 12). 특정 작제물의 분비된 면역글로불린을 단백질 A 친화성 정제로 정제하고 환원 및 비-환원 SDS-PAGE 겔 상에서 분석하였다. 세포내 시료를 또한 HC 및 LC 둘다에 대한 항체를 사용하여 웨스턴 블롯 분석으로 분석하였다(참조: 예를 들면, 도 3 및 도 4).Several sORF constructs were generated with light chain sequences that are variants from the immunoglobulin light chain of D2E7. These sORF constructs can also be processed into heavy chains as in D2E7 to produce IgG1 antibody material. Using the constructs pTT3 pfu lon HL (-) and pTT3 pab lon HL (-) as the backbone, the inventors used a sequence variation at the C-terminal splicing linkage, ie, the linkage between the intein and the lower immunoglobulin light chain component. Constructs with were generated and tested (Table 12). Secreted immunoglobulins of certain constructs were purified by Protein A affinity purification and analyzed on reducing and non-reducing SDS-PAGE gels. Intracellular samples were also analyzed by Western blot analysis using antibodies against both HC and LC (see, eg, FIGS. 3 and 4).

도 3은 sORF 발현 생성물의 단백질 분석을 위한 SDS-PAGE 겔의 결과를 도시한다. 분비된 IgG 분자를 단백질 A 친화성 크로마토그래피로 정제하고 SDS-PAGE 겔 상에서 비-환원(A) 및 환원 조건(B) 하에 분리하였다. 좌측으로부터 우측까지의 레인 및 시료는 다음과 같다: (레인 1) MW 마커; (2) 대조군 작제물 생성물, 비-sORF 발현 시스템으로부터의 D2E7 항체; (3) Pab-lon mut A1; (4) Pab-lon mut A2; (5) pTT3 pfu lon YP, 및 (6) pTT3 pfu lon MA.3 shows the results of SDS-PAGE gels for protein analysis of sORF expression products. Secreted IgG molecules were purified by Protein A affinity chromatography and separated under non-reducing (A) and reducing conditions (B) on SDS-PAGE gels. Lanes and samples from left to right are as follows: (lane 1) MW marker; (2) control construct products, D2E7 antibodies from non-sORF expression systems; (3) Pab-lon mut A1; (4) Pab-lon mut A2; (5) pTT3 pfu lon YP, and (6) pTT3 pfu lon MA.

도 4는 추가의 sORF 발현 생성물의 단백질 분석을 위한 SDS-PAGE 겔의 결과를 도시한다. 분비된 IgG를 단백질 A 친화성 크로마토그래피로 정제하고 SDS-PAGE 겔 상에서 비-환원(A) 및 환원(B) 조건하에 분리하였다. 좌측으로부터 우측까지의 레인 및 시료는 다음과 같다: (레인 1) MW 마커; (2) 대조군 D2E7 생성물; (3) pTT3 pfu lon HL (-); 및 (4) pTT3 pfu lon MutA. 4 shows the results of SDS-PAGE gels for protein analysis of additional sORF expression products. Secreted IgG was purified by Protein A affinity chromatography and separated under non-reducing (A) and reducing (B) conditions on an SDS-PAGE gel. Lanes and samples from left to right are as follows: (lane 1) MW marker; (2) control D2E7 product; (3) pTT3 pfu lon HL (−); And (4) pTT3 pfu lon MutA.

Figure pct00012
Figure pct00012

표 12의 작제물에 의해 생산된 면역글로불린 분비 농도는 표 13에 나타낸다. 성숙한 경쇄의 N-말단에서 아미노산을 측정하고 특성화된 부분 서열의 결과를 나타낸다.Immunoglobulin secretion concentrations produced by the constructs of Table 12 are shown in Table 13. Amino acids are measured at the N-terminus of the mature light chain and the results of the characterized partial sequences are shown.

Figure pct00013
Figure pct00013

결과result

이들 작제물의 경우, +1 위치에서 상이한 AA 잔기의 용도(인테인 직후)는 분비된 항체의 수율에 있어서 인자로 여겨졌다. 당해 위치에서 아미노산 잔기 H, Y, R, V, Q, A, N, 및 M의 용도는 비교적 보다 높은 수준의 항체 발현을 수득하였다. 이들의 N-말단 아미노산에 대한 경쇄의 분석(표 13)은 인테인의 C-말단에서 완전하고 정밀한 절단을 제안하였다. 작제물 pTT3 pfu lon HL(-) 및 pTT3 pab lon HL(-)에 의해 생산된 항체와 유사하게, 프로세싱된 HC 및 LC 또한 분비된 단백질 종의 대부분을 나타낸 완전한 항체를 조립하였다. 그러나, 아미노산 아스파르테이트(Asp; D)가 작제물 pTT3 pfu lon MutB에서와 같이 인테인 다음에 직접 사용된 경우, 항체 분비는 거의 없었다. 당해 작제물에 의해 생산된 세포내 단백질을 분석하였다. D가 인테인 다음의 제1 아미노산인 경우, C-말단 스플라이싱 연결부에서 절단은 거의 일어나지 않고, 소량의 항체 LC 및 비교적 다량의 인테인-LC 융합 단백질이 수득되었다. For these constructs, the use of different AA residues at the +1 position (right after intein) was considered a factor in the yield of secreted antibodies. The use of amino acid residues H, Y, R, V, Q, A, N, and M at this position yielded relatively higher levels of antibody expression. Analysis of the light chains for their N-terminal amino acids (Table 13) suggested complete and precise cleavage at the C-terminus of intein. Similar to the antibodies produced by the constructs pTT3 pfu lon HL (−) and pTT3 pab lon HL (−), processed HCs and LCs also assembled a complete antibody showing most of the secreted protein species. However, when amino acid aspartate (Asp; D) was used directly after intein as in construct pTT3 pfu lon MutB, there was little antibody secretion. Intracellular proteins produced by this construct were analyzed. When D is the first amino acid following intein, little cleavage occurs at the C-terminal splicing junction and a small amount of antibody LC and a relatively large amount of intein-LC fusion protein are obtained.

카파 동형 가변 영역(Vkappa)의 성숙한 배선(germ line) 경쇄의 아미노산 서열은 일반적으로 D, E, N, A, 또는 V로 개시하고; 람다 동형(Vlambda)의 것은 일반적으로 Q, S, L, 또는 N으로 개시한다. 본 발명자들의 결과로부터, 항체 생산을 위해 Pab lon 또는 Pfu lon 인테인을 사용하는 sORF 벡터의 양태는 어떠한 아미노산으로도 개시하는 LC를 갖는 것들을 포함한다. 바람직한 양태에서, 전체적인 완전한 프로세싱의 보다 높은 효율을 달성하기 위한 목적을 위해, 비록 이러한 아미노산이 작동적 선택으로 제공될 수 있다고 해도 LC는 D 또는 E 이외의 아미노산으로 개시한다.The amino acid sequence of the mature germ line light chain of the kappa isotype variable region (V kappa ) generally begins with D, E, N, A, or V; The same type of the lambda (V lambda) is generally initiated by the Q, S, L, or N. From the results of the inventors, embodiments of the sORF vector using Pab lon or Pfu lon intein for antibody production include those with LCs starting with any amino acid. In a preferred embodiment, for the purpose of achieving higher efficiency of overall complete processing, the LC starts with amino acids other than D or E, although such amino acids may be provided as an operational choice.

본 발명자들은, 인테인과 인테인으로부터의 하부의 성숙한 항체 LC 사이의 영역이 N-말단 스플라이싱 연결부에서 절단 효율에 기여하는 것으로 나타남을 발견하였다. 예를 들면, 본 발명자들은 작제물 pTT3 pfu lon HL (-) 및 pTT3 pfu lon MutA의 결과와 비교하였다. pTT3 pfu lon HL (-)이 사용된 경우 N-말단 스플라이싱 연결부에서 절단이 완전하지는 않지만, 일부 부분적으로 프로세싱된 HC-인테인 융합 단백질이 수득되며, 당해 단백질 종의 양은 작제물 pTT3 pfu lon MutA가 대신 사용된 경우에 유의적으로 감소한다(참조: 도 2). 따라서, 각종 작제물이 바람직한 생성물을 생성하는데 유용할 수 있지만, 특정 작제물이 특히 바람직한 생성물, 예를 들면, 완전히 프로세싱되고 자가-조립된 다합체성 분비된 항체의 비교적 보다 높은 수율을 생성하는 능력과 같이 기여할 수 있다.We have found that the region between intein and the underlying mature antibody LC from intein appears to contribute to cleavage efficiency at the N-terminal splicing junction. For example, we compared the results of the constructs pTT3 pfu lon HL (-) and pTT3 pfu lon MutA. When pTT3 pfu lon HL (-) is used, cleavage at the N-terminal splicing junction is not complete, but a partially partially processed HC-intein fusion protein is obtained and the amount of the protein species is construct pTT3 pfu lon Significantly decreases if MutA was used instead (see FIG. 2). Thus, while various constructs may be useful for producing the desired product, the particular construct may be capable of producing relatively higher yields of particularly desirable products, eg, fully processed and self-assembled multimeric secreted antibodies. Can contribute together.

실시예Example 3.  3. sORFsORF 작제물의Constructive 인테인Intaine 성분에 대한 추가의 선택 Additional Choices for Ingredients

메타노코쿠스Metanococcus 잔나스키이Jannaskyi  And 파이로코쿠스Pyrococcus 아비씨로부터의From his father klbAklbA 유전자의  Gene 인테인Intaine

본 발명자들은 메타노코쿠스 및 파이로코쿠스 종으로부터와 같은 klbA 유전자의 인테인을 포함하는 sORF 작제물에 대한 인테인 선택을 추가로 실험하였다. 본 발명자들은, klbA 유전자내에 함유된 인테인이 또한 각종의 단일 전사 해독 프레임 작제물 설계시 항체 중쇄 및 경쇄의 절단의 문맥에서를 포함하는 단백질 발현 및 프로세싱을 매개하기에 효율적인 선택임을 발견하였다.We further tested intein selection for sORF constructs that include the inteins of the klbA gene, such as from Metanococcus and Pyrococcus species. We have found that the inteins contained in the klbA gene are also efficient choices to mediate protein expression and processing, including in the context of cleavage of antibody heavy and light chains in the design of various single transcription translation frame constructs.

특히, 본 발명자들은 메타노코쿠스 잔나스키이(Mja klbA 인테인), 파이로코쿠스 아비씨(Pab klbA 인테인), 및 파이로코쿠스 푸리오수스(Pfu klbA 인테인)으로부터의 klbA 인테인을 시험하였다. 처음 2개의 유기체로부터의 인테인은 엔도뉴클레아데 도메인을 결여한 미니-인테인인 반면, Pfu klbA는 완전한 크기의 인테인이다. 천연의 인테인 단백질 분절의 서열 길이는 각각 168, 333, 및 522개 아미노산이다. 이들 인테인과 관련하여 서열 정보는 하기 표에 제공된다. 따라서, 인테인, 변형된 인테인, 및 작제물이 발현 시스템용으로 개발된다.In particular, we tested klbA intein from Metanococcus jannaskyi (Mja klbA intein), Pyrococcus acciae (Pab klbA intein), and Pyrococcus puriosus (Pfu klbA intein). . The intein from the first two organisms is a mini-intein lacking an endonucleade domain, while Pfu klbA is a full sized intein. The sequence length of the native intein protein segment is 168, 333, and 522 amino acids, respectively. Sequence information regarding these inteins is provided in the table below. Thus, intaines, modified intaines, and constructs are developed for expression systems.

KlbA 인테인 서열 및 벡터 작제물 설계KlbA Intein Sequence and Vector Construct Design

Mja klbA의 뉴클레오타이드 서열을 변형시켜 포유동물 코돈 용도의 상대적인 최적화를 허용하였다. 표 14는 이렇게 변형된 메타노코쿠스 잔나스키이의 Mja klbA 인테인 유전자에 대한 핵산 서열 정보를 제공한다(서열 번호 34). 표 15는 Mja KlbA 인테인 분절에 대한 단백질 서열 정보를 제공한다(또한 참조: NCBI/단백질, MJ0781내 수탁 번호 제Q58191호). 표 16은 천연 서열과 관련된 코돈 용도 국면에서 변형된 Pab klbA 인테인 유전자에 대한 핵산 서열 정보를 제공한다. 천연 서열의 경우, Pab KlbA 인테인에 대한 NEB Inbase 정보의 수탁 번호[NCBI/단백질, PAB1457내 B75050]를 또한 참조한다. 당해 공급원에 따라서, 나타낸 단백질 아미노산 서열은 각각 G 및 C인 것으로 나타나는 -1 및 +1 엑스테인 잔기를 포함하는 것으로 나타나 있다. 표 17은 Pab KlbA 인테인 단백질 분절에 대한 아미노산 서열 정보를 제공한다. 표 18은 Pfu klbA 인테인 유전자(천연)에 대한 핵산 서열 정보를 제공한다. 표 19는 Pfu KlbA 인테인 단백질 분절에 대한 아미노산 서열 정보를 제공한다(NCBI에서 수탁 번호 제AE010211호를 또한 참조).The nucleotide sequence of Mja klbA was modified to allow for relative optimization of mammalian codon usage. Table 14 provides nucleic acid sequence information for the Mja klbA intein gene of Metanococcus jannaskyi thus modified (SEQ ID NO: 34). Table 15 provides protein sequence information for the Mja KlbA intein segment (see also NCBI / protein, Accession No. Q58191 in MJ0781). Table 16 provides nucleic acid sequence information for modified Pab klbA intein genes in terms of codon usage related to native sequences. For native sequences, see also accession number (NCBI / protein, B75050 in PAB1457) of NEB Inbase information for Pab KlbA intein. According to this source, the indicated protein amino acid sequences are shown to contain -1 and +1 extein residues which appear to be G and C, respectively. Table 17 provides amino acid sequence information for Pab KlbA intein protein segments. Table 18 provides nucleic acid sequence information for the Pfu klbA intein gene (natural). Table 19 provides amino acid sequence information for Pfu KlbA intein protein segments (see also Accession No. AE010211 from NCBI).

Figure pct00014
Figure pct00014

Figure pct00015
Figure pct00015

Figure pct00016
Figure pct00016

Figure pct00017
Figure pct00017

Figure pct00018
Figure pct00018

Figure pct00019
Figure pct00019

본 발명자들은 포유동물 코돈 용도를 사용하는 서열을 사용하여 Mja klbA 인테인 및 Pab klbA 인테인의 뉴클레오타이드 서열을 합성하였다. 다음의 포유동물 발현 벡터를 작제한다: pTT3- Pab klbA HL(-); pTT3- Pab klbA HL(+); pTT3- Pab klbA LH(-); pTT3- Mja klbA HL(-); pTT3- Mja klbA HL(+); pTT3- Mja klbA LH(-). 이들 작제물은 본원에 또한 기술된 바와 같이, PTT3 벡터 골격에서 제조하였다. Pfu klbA 인테인 뉴클레오타이드 서열은 천연 서열이며, pTT3-Pfu-klbA-HL(+)를 또한 작제하였다.We synthesized the nucleotide sequences of the Mja klbA intein and Pab klbA intein using sequences using mammalian codon applications. The following mammalian expression vectors were constructed: pTT3- Pab klbA HL (−); pTT3- Pab klbA HL (+); pTT3- Pab klbA LH (−); pTT3- Mja klbA HL (−); pTT3- Mja klbA HL (+); pTT3- Mja klbA LH (−). These constructs were prepared in the PTT3 vector backbone, as also described herein. The Pfu klbA intein nucleotide sequence is a native sequence and pTT3-Pfu-klbA-HL (+) was also constructed.

Lon 프로테아제 인테인을 사용하는 작제물에 대해 나타낸 바와 같이, "HL" 명칭을 갖는 모든 작제물은 항체 면역글로불린 중쇄(HC) 암호화 서열에 이어 인테인 분절 및 이후 경쇄 (LC) 암호화 서열을 갖는다. 유사하게, "LH" 명칭을 갖는 모든 작제물은 항체 LC 암호화 서열에 이어 인테인 분절 및 이후 HC 암호화 서열을 갖는다. "(-)" 명칭을 사용한 작제물은 ORF의 개시부에 1개의 시그날 펩타이드 및 인테인 분절의 마지막 아미노산과 하부 엑스테인 분절, 예를 들면, 인테인 다음의 성숙한 항체 중쇄 또는 경쇄의 처음 아미노산 사이에 삽입된 메티오닌을 갖는다. "(+)" 명칭을 갖는 작제물은 ORF의 개시부에 1개의 시그날 펩타이드 및 인테인의 하부에 있는 항체 소단위의 개시부에서 제2의 시그날 펩타이드를 갖는다.As shown for constructs using the Lon protease intein, all constructs with the name "HL" have an antibody immunoglobulin heavy chain (HC) coding sequence followed by an intein segment and then a light chain (LC) coding sequence. Similarly, all constructs with the name "LH" have an antibody LC coding sequence followed by an intein segment and then an HC coding sequence. Constructs using the "(-)" designation are defined at the beginning of the ORF between the last amino acid of one signal peptide and intein segment and the first amino acid of the lower antibody segment, e.g., the mature antibody heavy or light chain following intein. Has methionine inserted in it. The construct with the name “(+)” has one signal peptide at the beginning of the ORF and a second signal peptide at the beginning of the antibody subunit below the intein.

각종 KlbA 인테인 분절 및 구조를 갖는 작제물을 일시적인 형질감염 기술을 통해 293E 세포내로 도입하였다. 형질감염 후 7 내지 8일 째에, 배양 상층액을 분비된 항체에 대해 ELISA를 사용하여 IgG 농도를 측정함으로써 분석하였다. 각각의 작제물 발현 시스템에 대해 시료의 ml당 미생물 단위의 값을 갖는 이들 결과에 대해서는 표 20을 참조한다.Constructs with various KlbA intein segments and structures were introduced into 293E cells via transient transfection techniques. Seven to eight days after transfection, culture supernatants were analyzed by measuring IgG concentration using ELISA on secreted antibodies. See Table 20 for these results with values of microbial units per ml of sample for each construct expression system.

Figure pct00020
Figure pct00020

본 발명자들은 작제물, pTT3- Pab klbA HL(-) 및 pTT3- Mja klbA HL(-)에 의해 발현된 분비된 항체 생성물을 정제하고 분석하였다. 항체 생성물을 단백질 A 친화성 크로마토그래피로 정제하고 SDS-PAGE의 전기영동 기술에 의해 환원 및 비-환원 둘 다의 조건 하에서 특성화하였다(참조: 도 5). 비-환원 조건하에서, 이들 2개의 벡터로부터의 배양 상층액 시료는 단일 밴드로서 그러나, 대조군 항체와 비교하여 명백하게 보다 높은 분자량을 갖는 단일 밴드로서 주로 이동하였다. 환원 조건하에서, 본 발명자들은 이들 2개의 벡터로부터의 배양 상층액 시료가 항체 LC 및 HC-인테인 융합 성분에 대해 크기에 있어 상응하는 검출가능한 밴드를 함유하였음을 발견하였다. IgG1 Fc 또는 카파 경쇄에 대한 어느 항체를 사용한 상응하는 면역블롯은 이들 밴드의 특성화와 일치한다. 이들 결과는, C-말단 스플라이싱 연결부에서 비교적 효율적인 절단이 존재하지만 N-말단 스플라이싱 연결부에서 전체적으로 절단은 효율적이지 않거나 심지어 거의 없음을 말한다. 그러나, 심지어 완전한 절단 효율보다 적게 달성되는 작제물 및 발현 시스템에 대해서조차, 면역글로불린 중쇄 및 경쇄 소단위는 완전한 IgG 항체 분자로서 조립되어 분비될 수 있었다.We have purified and analyzed secreted antibody products expressed by the constructs, pTT3-Pab klbA HL (−) and pTT3-Mja klbA HL (−). Antibody products were purified by Protein A affinity chromatography and characterized under conditions of both reducing and non-reducing by electrophoretic techniques of SDS-PAGE (see FIG. 5). Under non-reducing conditions, the culture supernatant samples from these two vectors migrated primarily as a single band but as a single band with apparently higher molecular weight compared to the control antibody. Under reducing conditions, we found that culture supernatant samples from these two vectors contained corresponding detectable bands in size for the antibody LC and HC-intein fusion components. The corresponding immunoblot with either antibody against IgG1 Fc or kappa light chain is consistent with the characterization of these bands. These results indicate that there is a relatively efficient cleavage at the C-terminal splicing connection, but the cleavage at the N-terminal splicing connection is not efficient or even nearly total. However, even for constructs and expression systems where less than complete cleavage efficiency is achieved, immunoglobulin heavy and light chain subunits could be assembled and secreted as complete IgG antibody molecules.

N-말단 인테인 스플라이싱 연결부에서 Klb 인테인의 변형Modification of Klb Intein at N-terminal Intein Splicing Connection

N-말단 스플라이싱 연결부에서 절단을 위한 상기에서 기술한 결과의 관점에서, 본 발명자들은 추가의 노력을 기울여 향상된 절단 효능을 제공하였다. 본 발명자들은, 이들 2개의 인테인, Pab klbA 및 Mja klbA 각각의 제1 아미노산이 시스테인(Cys; C) 대신 알라닌(Ala; A)임을 주목하였다. 본 발명자들은, 시스테인이 다른 인테인 시스템에서 친핵체로서 기능할 수 있는 잔기임을 이해한다. 본 발명자들은, 당해 위치에서 친핵성 아미노산, 시스테인의 재도입의 효과를, 면역글로불린 HC 분절의 끝에서, 인테인의 klbA 엑스테인 상부에 대해 천연적인, 하나의 아미노산, 글리신을 도입함과 함께, 시험하였다. 이들 추가의 작제물에 대한 단백질 분절에 대해 서열 정보를 제공하는 표 21을 참조한다. 당해 표는 천연의 Pab klba 인테인, Pab klba HL(-) 작제물(이는 당해 문맥에서 WT로 언급됨), 및 N-말단 스플라이싱 연결부에서 돌연변이를 갖는 3개의 작제물: Pab klba HL(-)GC; Pab klba HL(-)GA; 및 Pab klba HL(-)KC에 대한 2개의 스플라이싱 연결부에서 아미노산 잔기를 제공한다. 별표(*)는, 변이체 아미노산 잔기가 돌연변이체 작제물내에 도입된 위치를 나타낸다. 이들 작제물 중에서, Pab-klbA HL(-)GC는 N-말단 인테인 연결부에서 효율적인 절단과 함께 단백질을 발현하고 프로세싱하기 위한 능력이 입증되었다. 특정 작제물로부터 IgG 단백질의 발현 및 SDS-PAGE 분석의 결과를 도시하는 도 6을 또한 참조한다.In view of the results described above for cleavage at the N-terminal splicing connection, the inventors have made additional efforts to provide improved cleavage efficacy. The inventors noted that the first amino acid of each of these two inteins, Pab klbA and Mja klbA, is alanine (Ala; A) instead of cysteine (Cys; C). We understand that cysteine is a moiety that can function as a nucleophile in other intein systems. The inventors have introduced the effect of reintroduction of the nucleophilic amino acid, cysteine, at this position, at the end of the immunoglobulin HC segment, with one amino acid, glycine, which is natural to the klbA extein top of the intein, Tested. See Table 21, which provides sequence information for the protein segments for these additional constructs. The table shows three constructs with mutations at the native Pab klba intein, Pab klba HL (-) constructs (which are referred to in the context as WT), and at the N-terminal splicing junction: Pab klba HL ( -) GC; Pab klba HL (-) GA; And two splicing linkages to Pab klba HL (-) KC. Asterisk ( * ) indicates the position at which the variant amino acid residue was introduced into the mutant construct. Among these constructs, Pab-klbA HL (-) GC demonstrated the ability to express and process proteins with efficient cleavage at the N-terminal intein junction. See also FIG. 6, which depicts the expression of IgG proteins and the results of SDS-PAGE analysis from certain constructs.

Figure pct00021
Figure pct00021

Figure pct00022
Figure pct00022

벡터의 생성을 위한 물질 및 방법: Materials and Methods for the Generation of Vectors: PabPab -- klbAklbA HLHL (-) (-) 변이체Mutant GAGA , , GCGC , 및 , And KCKC 의 작제Construction of

특정의 벡터 작제물의 몇가지 변이체 형태를 생성하였다. Pab-klbA HL(-) 돌연변이체 GA, GC, 및 KC를 PCR로 작제하였다. 전방(forward) 프라이머 HC-F 및 역(reverse) 프라이머 Hint-R을 사용하여 중쇄의 3' 말단에서 PCR 증폭시켜 PCR 생성물 #1을 생성하였다. 전방 프라이머 GA-F, GC-F, 및 KC-F는 바람직한 돌연변이 및 중쇄의 3' 말단에서 상보성 서열을 함유하였다. 프라이머 GA-F, GC-F, 또는 KC-F 및 역 프라이머 인테인-R-2를 사용하여 Pab-klbA 인테인의 5' 말단에서 증폭시켜 PCR 생성물 #2를 생산하였다. 이후에, PCR 생성물 #1 및 #2를 키아겐 겔 추출 키트(Qiagen Gel Extraction kit)를 사용하여 정제하였다. 정제된 PCR 생성물을 함께 어닐링하고 외부 프라이머 HC-F 및 인테인-R-2를 사용하여 증폭시켜 PCR 생성물 #3을 생성하였다. 벡터 Pab-klbA HL(-)를 제한 효소 Sacll 및 Rssll을 사용하여 분해한 후 키아겐 겔 추출 키트를 사용하여 정제하였다. PCR 생성물 #3을 Pab-klbA-HL(-)(Sacll 및 Rssll로 절단)내로 최대 효율 DH5α 세포[제조원: 인비트로겐(Invitrogen)] 내에서 동종 재조합에 의해 아클로닝(subcloning)하였다. 정확한 돌연변이를 수반하는 형질전환체를 콜로니 PCR에 이은 서열 분석을 사용하여 측정하였다. 정확한 클론으로부터의 DNA를 증폭시키고 키아겐 맥시 키트(Qiagen Maxi kit)를 사용하여 정제하였다. 프라이머 서열을 하기 표에 나타낸다.Several variant forms of specific vector constructs were generated. Pab-klbA HL (-) mutants GA, GC, and KC were constructed by PCR. PCR product # 1 was generated by PCR amplification at the 3 'end of the heavy chain using forward primer HC-F and reverse primer Hint-R. Forward primers GA-F, GC-F, and KC-F contained complementary sequences at the 3 'end of the preferred mutations and heavy chains. PCR product # 2 was produced by amplification at the 5 'end of the Pab-klbA intein using primers GA-F, GC-F, or KC-F and reverse primer intein-R-2. Thereafter, PCR products # 1 and # 2 were purified using Qiagen Gel Extraction kit. Purified PCR products were annealed together and amplified using external primers HC-F and intein-R-2 to generate PCR product # 3. Vector Pab-klbA HL (-) was digested using restriction enzymes Sacll and Rssll and then purified using a Kiagen gel extraction kit. PCR product # 3 was subcloned by homologous recombination in maximal efficiency DH5α cells (Invitrogen) into Pab-klbA-HL (-) (cut into Sacll and Rssll). Transformants carrying the correct mutations were determined using colony PCR followed by sequence analysis. DNA from the correct clone was amplified and purified using the Qiagen Maxi kit. Primer sequences are shown in the table below.

Figure pct00023
Figure pct00023

실시예Example 4.  4. sORFsORF 작제물을Construct 발현하는 안정한 벡터 및 세포주의 생성 Generation of expressing stable vectors and cell lines

안정한 발현 벡터 및 이러한 벡터를 발현하는 세포주를 sORF 작제물의 양태를 사용하여 개발할 수 있다. 예로서, Pab Lon 인테인을 지닌 sORF를 함유하는 안정한 발현 벡터를 CHO(챠이니즈 햄스터 난소) 세포주내로 안정하게 형질감염시켰다. 본 발명자들은 CMV 인핸서, 아데노바이러스 주요 레이트 프로모터, SV40 폴리A 서열, 가스트린 전사 터미네이터, SV40 프로모터에 의해 구동된 DHFR 암호화 서열, 및 일시적인 발현 시스템에서 사용된 pTT3 pab lon HL(-)내의 것과 동일한 ORF를 포함하는 성분들을 지닌 안정한 sORF 발현 벡터를 설계하고 제조하였다. 따라서, sORF 작제물 pA190-Pab-lon HL(-)를 제조하여 안정한 발현 벡터로서 사용할 수 있다; 도 7을 참조한다. 추가의 작제물을 유사하게 제조한다.Stable expression vectors and cell lines expressing such vectors can be developed using aspects of the sORF construct. As an example, stable expression vectors containing sORF with Pab Lon intein were stably transfected into CHO (Chinese Hamster Ovary) cell lines. We used the same ORF as in CMV enhancer, adenovirus major rate promoter, SV40 polyA sequence, gastrin transcription terminator, DHFR coding sequence driven by SV40 promoter, and pTT3 pablon HL (-) used in transient expression system. Stable sORF expression vectors with components were designed and constructed. Thus, the sORF construct pA190-Pab-lon HL (-) can be prepared and used as a stable expression vector; See FIG. Additional constructs are similarly prepared.

인산칼슘 형질감염 기술을 사용하여, pA190 작제물을 CHO 세포(CHO B3.2로 지명)내로 도입시키고 당해 세포를 48개의 96-웰 플레이트에 200개 세포/웰의 밀도로 MEM 및 5% FBS를 함유하는 선택 배지 속에 플레이팅하였다. 형질감염 플레이트를 세포/콜로니의 성장 및 IgG 분비에 대해 모니터링하였다.Using calcium phosphate transfection technology, the pA190 construct was introduced into CHO cells (designated CHO B3.2) and the cells were loaded with MEM and 5% FBS at a density of 200 cells / well in 48 96-well plates. Plated in the selection medium containing. Transfection plates were monitored for growth of cells / colonies and IgG secretion.

sORF 안정한 발현 벡터 pA190-Pab-lon HL(-)로부터의 30개 클론 및 대조군 안정한 발현 벡터 pA190 형질감염 반응물로부터의 32개 클론의 시료채취물을 선택하여 성장시켰다. 당해 단계에서, IgG 분비 농도를 증폭없이 선택된 클론에 대해 평가하고, 농도를 또한 20 nM 메토트렉세이트(MTX)를 사용하여 증폭 후 평가하였다. 안정한 발현 시스템의 경우, sORF 벡터는 적절한 수(2304개 중 443개) 및 비율, 즉 IgG 분비에 대해 양성인 시료 중 19%를 갖는 성장 양성 웰(4608개의 총 웰 중 2304개가 양성임)의 유의적인 빈도를 생성하였다. 12-웰 플레이트 속에서 0 nM MTX의 조건하에 IgG 분비 농도는 ~29개의 선택된 클론의 경우 배양 상층액 ml당 약 0.3 내지 약 2.5 ㎍의 범위이었다. 20 nM MTX를 사용한 조건하에서, ~24개의 선택된 클론의 경우 IgG 분비 농도는 2㎍/ml보다 높은 분비 농도를 입증하는 골라낸 클론의 약 1/2의 사용시 ml당 약 0.1 내지 약 6㎍의 범위이었다. sORF 작제물 클론은 부착성 배양물 용기 속에서 상대적으로 신속한 합치성을 입증하였음이 주목되었다. 예를 들면, 20 nM MTX를 사용한 부착성 배양물 속에서, SORF 클론은 보다 신속하게 성장하여 통상의 벡터 클론보다 더 신속하게 합치성에 이르렀다. 20 nM MTX 속에서 1회 계대배양시, 통상의 벡터로부터의 클론의 28%가 6일내에 합치성에 도달하였으며(4일, 5일 또는 6일); 여기서, sORF pab lon 벡터로부터의 클론의 77%가 6일내에 합치성에 도달하였다(참조: 도 8). 이들 데이타는, CHO 세포주 발달을 포함하는 안정한 발현 시스템의 개발시, 통상의 벡터와 비교하여 sORF 발현 벡터를 사용하는 강력한 장점을 제안한다. sORF 클론은 또한 100 nM MTX를 사용한 직접적인 증폭 조건하에서 유리한 수준의 항체 분비를 입증하였다. 실험에서, 100 nM MTX에 노출된 16개 클론은 평균 6 ㎍/ml의 IgG 분비 농도를 수득하였고, 상부 5개 클론은 평균 12㎍/ml이었으며 상부 클론의 생산 농도는 24㎍/ml였다. 하기 표는 각각의 증폭 단계에서 최대 발현 수준의 MTX 증폭을 사용한 결과를 나타낸다. 값들은 pA190-Pab-lon-HL(-) 작제물을 갖는 각종 클론에 대해 IgG의 ml당 ㎍이다.Thirty clones from the sORF stable expression vector pA190-Pab-lon HL (−) and 32 clones from the control stable expression vector pA190 transfection reaction were selected and grown. In this step, IgG secretion concentrations were evaluated for selected clones without amplification, and concentrations were also assessed after amplification using 20 nM methotrexate (MTX). For a stable expression system, the sORF vector is significant in growth positive wells (2304 out of 4608 total wells) with the appropriate number (443 out of 2304) and ratio, ie, 19% of the samples positive for IgG secretion. Frequency was generated. IgG secretion concentrations under conditions of 0 nM MTX in 12-well plates ranged from about 0.3 to about 2.5 μg per ml of culture supernatant for ˜29 selected clones. Under conditions using 20 nM MTX, IgG secretion concentrations for ˜24 selected clones ranged from about 0.1 to about 6 μg per ml using about one half of the cloned clones demonstrating a secretion concentration higher than 2 μg / ml. It was. It was noted that sORF construct clones demonstrated relatively rapid conformity in adherent culture vessels. For example, in adherent cultures with 20 nM MTX, SORF clones grew more rapidly and reached conformity faster than conventional vector clones. On one passage in 20 nM MTX, 28% of clones from conventional vectors reached consensus within 6 days (4, 5 or 6 days); Here, 77% of the clones from the sORF pab lon vector reached consensus within 6 days (see Figure 8). These data suggest a strong advantage of using sORF expression vectors as compared to conventional vectors in the development of stable expression systems involving CHO cell line development. The sORF clone also demonstrated favorable levels of antibody secretion under direct amplification conditions with 100 nM MTX. In the experiment, 16 clones exposed to 100 nM MTX obtained an average IgG secretion concentration of 6 μg / ml, the top five clones averaged 12 μg / ml and the production concentration of the top clone was 24 μg / ml. The table below shows the results of using MTX amplification of the maximum expression level in each amplification step. Values are μg per ml of IgG for various clones with pA190-Pab-lon-HL (−) constructs.

Figure pct00024
Figure pct00024

안정한 발현 시스템을 위한 물질 및 방법Materials and Methods for Stable Expression Systems

H/T 및 10% 투석된 FBS가 보충된 알파 MEM 속에서 배양된 차이니즈 햄스터 난소 세포를 인산칼슘 공-침전 과정을 사용하여 발현 벡터로 형질감염시켰다[참조: Kingston, R.E., et al. (1993), Unit 16.23: Amplification Using CHO Cell Expression vectors, Current Protocols in Molecular Biology (Ausubel, F.M., Brent, R., Moore, D.M., Kingston, R.E., Seidman, J.G., Smith, J.A., and Struhl, K., eds; Wiley Interscience, New York), 2:16.23.1]. 다음날, 세포를 트립신/EDTA를 사용하여 실온에서 형질감염시키고 5% 투석된 FBS(α-MEM + 5% dFBS), 발현 벡터로부터 DHFR을 발현하는 형질감염된 세포에 대해 선택적인 성장 배지가 보충된 알파 MEM 속에 재현탁시켰다. 선택에서 생존한 배양 상층액을 사람 IgG 감마 쇄에 대해 특이적인 ELISA를 사용하여 스크리닝하였다. 최대 ELISA 시그날을 제공하는 세포주를 α-MEM + 5% dFBS 함유 MTX 속에서 배양하였다. MTX는 벡터의 증폭으로 인하여 보다 높은 농도의 효소를 생산하는 세포에 대해 선택한 DHFR의 억제제이다. 세포주를 각종 농도의 MTX 속에서 배양하고 항체의 발현에 대해 모니터링하였다.Chinese hamster ovary cells cultured in alpha MEM supplemented with H / T and 10% dialysis FBS were transfected with expression vectors using a calcium phosphate co-precipitation procedure. Kingston, R.E., et al. (1993), Unit 16.23: Amplification Using CHO Cell Expression vectors, Current Protocols in Molecular Biology (Ausubel, FM, Brent, R., Moore, DM, Kingston, RE, Seidman, JG, Smith, JA, and Struhl, K. , eds; Wiley Interscience, New York), 2: 16.23.1]. The following day, cells were transfected with trypsin / EDTA at room temperature and 5% dialyzed FBS (α-MEM + 5% dFBS), alpha supplemented with growth medium selective for transfected cells expressing DHFR from expression vector Resuspend in MEM. Culture supernatants surviving the selection were screened using ELISA specific for human IgG gamma chain. Cell lines providing the maximal ELISA signal were incubated in MTX containing α-MEM + 5% dFBS. MTX is an inhibitor of DHFR chosen for cells that produce higher concentrations of enzyme due to amplification of the vector. Cell lines were incubated in various concentrations of MTX and monitored for expression of antibodies.

양태들에서, 본 발명의 조성물 및 방법은 예를 들면, 2008년 10월 2일자로 출원된 기온(Gion) 등의 제US 20080241883호에 기술된 바와 같이, pA205 벡터 작제물, 또는 이의 유도체를 사용할 수 있다.In aspects, the compositions and methods of the present invention may employ pA205 vector constructs, or derivatives thereof, as described, for example, in US 20080241883, filed Oct. 2, 2008, to Gion et al. Can be.

따라서, 안정한 세포 발현 시스템을 다양한 sORF 설계 및 작제물을 사용하여 생성한다. 특히, sORF 시스템은 항체 분자와 같은 생물학적 치료제의 발현을 위한 CHO 플랫폼을 사용한 통합에 매우 적합하다.
Thus, stable cell expression systems are generated using various sORF designs and constructs. In particular, the sORF system is well suited for integration using the CHO platform for the expression of biological therapeutics such as antibody molecules.

실시예 5. sORF 작제물에서 인테인 C-말단 스플라이싱 연결에 대한 국면의 특성화Example 5 Characterization of Aspects to Intein C-Terminal Splicing Connections in sORF Constructs

본 발명자들은 sORF 작제물과 관련하여 인테인 C-말단 스플라이싱 연결의 국면을 시험하였다. 본 발명자들은 부분적으로 약 40개의 새로운 작제물을 생성하여 인테인의 하부의 제1 아미노산 및 C-말단 스플라이싱 연결부에서 절단 효율에 영향을 미칠 수 있는 스프라이싱 연결 길이와 관련된 국면을 특성화하였다. 이들 추가의 작제물은 경쇄 연결 돌연변이의 변이를 가졌다. 개괄적으로, 본 발명자들은 경쇄의 N-말단 끝에서 또는 근처의 잔기에 초점을 맞추었으며; 1번 위치에서의 메티오닌(Met1) 및 2번 위치에서의 아스파르테이트(Asp2) 각각을 20개의 가능한 천연 아미노산 잔기 모두로 교체하였다(참조: 도 9). 이들 2개의 일련의 경쇄 연결 돌연변이 작제물은 D2E7 항체 암호화 서열 및 HC-인테인-LC 구조에서 Pab Lon 인테인 분절을 사용하였다.We tested aspects of intein C-terminal splicing linkages in the context of sORF constructs. We have created about 40 new constructs in part to characterize aspects related to splicing linkage lengths that can affect cleavage efficiency at the first amino acid and C-terminal splicing linkages at the bottom of the intein. These additional constructs had mutations in the light chain linkage mutations. In general, we focused on residues at or near the N-terminal end of the light chain; Each of methionine (Met1) at position 1 and aspartate (Asp2) at position 2 was replaced with all 20 possible natural amino acid residues (see FIG. 9). These two series of light chain linkage mutant constructs used Pab Lon intein segments in the D2E7 antibody coding sequence and HC-intein-LC structure.

작제물을 293 세포내로 형질감염시켰다. 일시적인 발현은 Met 치환 작제물중 대부분을 사용하여 높은 IgG 역가를 수득하였으며, 이들 작제물 다수는 당해 위치에 Met를 갖는 대조군 작제물보다 더 높은 발현 수준을 수득하였다(참조: 도 10). Asp 치환 작제물은 일반적으로 보다 낮은 수준의 항체 발현을 수득하였다(참조: 도 11).The construct was transfected into 293 cells. Transient expression resulted in high IgG titers using most of the Met substitution constructs, many of which yielded higher expression levels than control constructs having Met at this position (FIG. 10). Asp substitution constructs generally yielded lower levels of antibody expression (see FIG. 11).

폴리프로테인 프로세싱의 효율을 시험하였다(예를 들면, 참조: 도 12). Met의 변이를 기초로 한 작제물의 라이브러리는 앞서 기술된 Pab Lon HL(-) 작제물과 유사하게, 폴리프로테인로부터 HC 및 LC 둘다의 효율적인 프로세싱을 생산하였다. Asp의 변이를 기초로 한 작제물의 라이브러리는 비교적 손상된 C-말단 프로세싱을 갖는 것으로 나타나며 아주 적은 양의 LC 및 유의적인 양의 인테인-LC 융합 단백질 종을 생성하였다. 불완전한 절단의 당해 결과는 스플라이싱 연결부에서 아미노산 특성에 대해 비의존성인 것으로 해석되므로 하나의 아미노산 단위의 전체 길이 차이와 관련된 것으로 나타난다. 그러나, 비교적 비효율적인 작제물도 여전히 일부 IgG 생성물을 생산할 수 있음에 주목한다.The efficiency of polyprotein processing was tested (see, eg, FIG. 12). A library of constructs based on the variation of Met produced efficient processing of both HC and LC from polyproteins, similar to the Pab Lon HL (−) constructs described above. Libraries of constructs based on variations of Asp appear to have relatively impaired C-terminal processing and produced very small amounts of LC and significant amounts of intein-LC fusion protein species. This result of incomplete cleavage appears to be related to the total length difference of one amino acid unit as it is interpreted as being independent of amino acid properties at the splicing junction. However, it is noted that relatively inefficient constructs can still produce some IgG products.

실험에서, 메티오닌-변이 라이브러리에서 20개 작제물 중 10개로부터의 IgG 항체 생성물을 추가로 분석하였다. 시료는 단백질 A 친화성 크로마토그래피를 사용하여 정제된 뱃치였고, 경쇄 성분들을 분자량의 평가를 포함하는 질량 분광법으로 분석하였다. 질량 분석법의 결과는, 특정 작제물(Pab lon M1 A, Pab lon M1 D, Pab lon M1 E, Pab lon M1 F, Pab lon M1 G, Pab lon M1 H, Pab lon M1 I, Pab lon M1 K, Pab lon M1 L, 및 Pab lon M1 C)로부터의 항체 경쇄가 인테인-매개된 반응을 통해 발생하는 정밀한 절단으로 작제물 설계시 가공된 바와 같이 형성시켰음을 나타내었다. Cys가 사용되어 Met로 교체된 작제물은 거의 프로세싱되지 않은 HC 및 LC 성분을 생산하였으며 스플라이싱 생성물일 수 있는 1개의 단백질 종을 함유하였고, 이는, 항체 경쇄의 +1 위치에서 Cys가 어느 정도 단백질 스플라이싱을 지지함을 제안한다. 생산된 모든 항체 경쇄에서, LC의 제1 아미노산의 존재는, 이들 벡터를 사용하여 생산된 항체 생성물이 LC N-말단 영역내 동종일 것이며 LC가 내인성일 수 있는 아미노 펩티다제 활성에 의해 프로세싱에 민감함을 입증한다.
In the experiment, IgG antibody products from 10 of 20 constructs were further analyzed in the methionine-variable library. Samples were batches purified using Protein A affinity chromatography and the light chain components were analyzed by mass spectroscopy, including evaluation of molecular weight. The results of mass spectrometry show specific constructs (Pab lon M1 A, Pab lon M1 D, Pab lon M1 E, Pab lon M1 F, Pab lon M1 G, Pab lon M1 H, Pab lon M1 I, Pab lon M1 K, It was shown that antibody light chains from Pab lon M1 L, and Pab lon M1 C) were formed as processed in construct design with precise cleavage occurring through intein-mediated reactions. Constructs where Cys was used and replaced with Met produced almost unprocessed HC and LC components and contained one protein species, which may be a splicing product, with some degree of Cys at the +1 position of the antibody light chain. It is proposed to support protein splicing. In all the antibody light chains produced, the presence of the first amino acid of the LC indicates that the antibody product produced using these vectors will be homogenous in the LC N-terminal region and processed by amino peptidase activity where the LC may be endogenous. Demonstrate sensitivity

실시예Example 6.  6. sORFsORF 작제물을Construct 사용한 항체  Used antibodies ABTABT -847의 발현Expression of -847

본 발명자들은 사람 람다 경쇄를 포함하는 항체를 발현하도록 조정된 sORF 작제물을 개발하였다. 본 발명자들은, 항원, 인터루킨-12에 대해 특이성을 갖는 완전한 사람 항체인 ABT-847을 사용하여 작업하였다. 당해 항체는 사람 IgG1 동형의 중쇄 및 람다 동형의 경쇄를 갖는다(참조: 사람 IL-12에 결합하는 사람 항체 및 생산 방법에 대해서는 2005년 7월 5일자 출원된 살펠트(Salfeld) 등의 미국 특허 제6,914,128호 참조).We have developed sORF constructs adapted to express antibodies comprising human lambda light chains. We worked with ABT-847, a fully human antibody with specificity for the antigen, interleukin-12. The antibody has heavy and lambda isomeric light chains of human IgG1 isomorphism (see, eg, US Patent No. 6,914,128).

ABT-874를 발현할 수 있는 5개의 sORF 작제물을 동종 재조합을 사용하여 제조하였다. 도 13은 이들 작제물의 SORF 성분의 구조를 도시한다. 작제물 중 3개는 HC-인테인-LC의 구조를 가졌으며, 2개의 작제물은 LC-인테인-HC의 구조를 가졌다. 이들 벡터를 HEK293 세포내로 일시적인 형질감염을 통해 도입시키고, 이들의 항체 발현 수준을 IgG ELISA로 평가하였다. 3개의 HC-인테인-LC 작제물은 유사한 구조(HC-인테인-LC)를 가지지만 D2E7 항체 분절을 갖는 작제물의 것과 유사한 배양물 상층액의 시료 속에서 항체의 역가를 수득하였다. 이들 경우들 둘다에서, ABT-874 및 D2E7 sORF 발현 시스템은 Pab Lon HL(-) 국면을 사용하였다. LC-인테인-HC 구조에 있어서 ABT-874 항체 분절을 갖는 2개의 작제물은 보다 낮은 수준의 IgG 역가를 수득하였다.Five sORF constructs capable of expressing ABT-874 were prepared using homologous recombination. 13 shows the structure of SORF components of these constructs. Three of the constructs had the structure of HC-intein-LC, and two constructs had the structure of LC-intein-HC. These vectors were introduced into HEK293 cells via transient transfection and their antibody expression levels were assessed by IgG ELISA. The three HC-intein-LC constructs obtained titers of antibody in samples of culture supernatants with similar structure (HC-intein-LC) but similar to the constructs with D2E7 antibody fragments. In both of these cases, the ABT-874 and D2E7 sORF expression systems used the Pab Lon HL (−) phase. Two constructs with ABT-874 antibody segments in the LC-intein-HC structure yielded lower levels of IgG titers.

상층액에서 생산된 IgG의 시료는 단백질 A 친화성 크로마토그래피에 의해 정제되고 SDS-PAGE 전기영동에 의해 분석된 뱃치이었다. 이들 분석물은, LC 성분이 모든 3개의 HC-인테인-LC 작제물에서 폴리프로테인로부터 완전히 프로세싱되었음을 나타내었다.Samples of IgG produced in supernatants were batches purified by Protein A affinity chromatography and analyzed by SDS-PAGE electrophoresis. These analytes showed that the LC component was fully processed from the polyprotein in all three HC-intein-LC constructs.

IgG 시료를 또한 질량 분광법을 사용하여 특성화하였다. 당해 분석은, 3개의 HC-인테인-LC 작제물로부터 생산된 LC가 작제물 설계에 따라 적절한 아미노산으로 개시하였음을 확인하였다. 당해 결과는 구조에 사용된 인테인에 의해 매개되는 정밀한 절단과 일치한다. 추가의 메티오닌 잔기를 가지지 않는 2개의 작제물로부터 생산된 LC 성분은 ABT-874 항체의 대조군 시료로부터의 물질과 동일했다. 따라서, 변형이 D2E7 항체의 경우에 수행된 바와 같이 달성될 수 있다고 해도, 이러한 변형은 기술된 작제물로부터 발현 생성물에서 목적하는 N-말단 LC 아미노산 서열의 달성 관점에서 임의적이다. 질량 분석법 분석을 또한 사용하여 작제물 설계에 따라 예측된 MW를 입증한, HC의 분자량을 평가하였다.
IgG samples were also characterized using mass spectroscopy. This analysis confirmed that the LC produced from the three HC-intein-LC constructs started with the appropriate amino acid according to the construct design. The results are consistent with the precise cleavage mediated by the intaines used in the structure. The LC component produced from two constructs without additional methionine residues was identical to the material from the control sample of the ABT-874 antibody. Thus, although modifications can be achieved as performed in the case of D2E7 antibodies, such modifications are optional in terms of achieving the desired N-terminal LC amino acid sequence in the expression product from the described constructs. Mass spectrometry analysis was also used to evaluate the molecular weight of HC, demonstrating the MW predicted according to the construct design.

실시예Example 7.  7. 인테인Intaine -계 정제 태그를 사용한 -Based tablet tag sORFsORF 작제물Construct

본 발명의 양태들에서, 작제물을 삽입체를 사용하여 설계한다. 삽입체를 지닌 작제물의 양태들에서, 삽입체는 검출가능한 시그날을 제공할 수 있거나 결합 또는 인식 성분을 제공하는데 유용하다. 본 발명의 양태들에서, 작제물을 설계하여 이러한 생성물중 하나 이상으로부터 특정의 작제물-관련된 발현 생성물의 분리를 촉진한다. 예를 들면, 벡터 설계를 생성하여 인테인 스플라이싱 반응으로부터 부분적으로 프로세싱된 단백질을 포함하는 성분들의 혼합물로부터 완전히 프로세싱되고, 조립된 다합체성 항체 생성물의 정제를 허용한다. HL 작제물의 발현과 관련하여, H-인테인-L의 구조는 H-인테인 또는 인테인-L 연결 중 하나 또는 둘다에서 불완전한 절단 반응을 초래함으로써 H, 인테인 및 L 성분을 생성할 수 있는 완전한 효율적인 절단의 달성과는 대치되는 것으로서, H-인테인, 인테인-L, 또는 3중 H-인테인-L의 단백질 부산물을 생성한다. 그러나, 후자의 상황에서 조차, 인테인 성분을 제거하는 것이 유용할 수 있다. 따라서, 전략을 개발하여 인테인에 태그, 바람직하게는 내부 태그를 갖춤으로써 인테인 절단 및/또는 연결 반응의 적어도 부분적인 효율을 허용하였다.In aspects of the present invention, constructs are designed using inserts. In aspects of a construct with an insert, the insert can provide a detectable signal or is useful for providing a binding or recognition component. In aspects of the invention, constructs are designed to facilitate the separation of certain construct-related expression products from one or more of these products. For example, a vector design can be generated to allow purification of a fully processed, assembled multimeric antibody product from a mixture of components including a protein partially processed from an intein splicing reaction. With respect to the expression of the HL construct, the structure of H-intein-L can produce H, intein and L components by causing an incomplete cleavage reaction at either or both H-intein or intein-L linkage. As opposed to achieving complete efficient cleavage, the protein byproduct of H-intein, intein-L, or triple H-intein-L is produced. However, even in the latter situation, it may be useful to remove the intein component. Thus, strategies have been developed to allow at least partial efficiency of intein cleavage and / or ligation reactions by having tags, preferably internal tags, in the intein.

본원의 어디엔가 기술된 바와 같이, sORF 작제물로부터의 배양 상층액의 시료 속에서, 본 발명자들은 면역글로불린 중쇄 및/또는 경쇄 중 어느 것에 부착된 인테인 단백질을 함유하는 몇가지 부분적으로 프로세싱된 중간체를 관측하였다. 본 발명자들은 Pfu lon 및 Pab lon 인테인이 내부 다중히스티딘 태그(IHT)를 함유하는 sORF 작제물을 설계하여 왔다. 이는 프로세싱되지 않은 오염물의 신속하고 효율적인 분리를 허용하는 조성물 및 방법을 제공한다.As described elsewhere herein, in a sample of the culture supernatant from the sORF construct, we found several partially processed intermediates containing intein proteins attached to either the immunoglobulin heavy and / or light chains. Observed. We have designed sORF constructs in which the Pfu lon and Pab lon inteins contain an internal multihistidine tag (IHT). This provides compositions and methods that allow for the rapid and efficient separation of unprocessed contaminants.

본 발명자들은, 인테인이 펩타이드 또는 거대한 단백질을 삽입시킴에 의해 변형될 수 있음을 발견하였다. 바람직하게는, 삽입은 용매 접근가능한 루프내로 이루어진다. 구조적 모델화와 함께 몇가지 인테인의 서열 정렬의 분석에 의해, 본 발명자들은 파이로코쿠스 아비씨(PAB) LON 인테인 및 파이로코쿠스 푸리오수스(PFU) LON 인테인 둘다 내에서 용매 접근가능한 루프를 확인하였다. 당해 루프는 엔도뉴클레아제(H) 도메인 모티프와 인테인의 F/G 블록 사이에 위치하였다(참조: 도 14). 도 14는, 태그를 포함하는 삽입체의 도입을 위한 H와 F/G 블록사이의 용매 접근가능한 루프의 바람직한 위치(점선 화살표)의 위치과 관련하여 인테인의 특정의 구조적 모티프를 도시한다(참조: 인터넷 웹사이트에서 사용가능한 정보, http://tools.neb.com/inbase/motifs_endo .php (InBase, The Intein Database:DOD Homing Endonuclease Motifs; InBase Reference: Perler, F. B., 2002, InBase, the Intein Database, Nucleic Acids Res. 30, 383-384)(모티프를 포함하는 특정의 인테인 구조적 특징을 나타내는 개략도 공급원). 본 발명자들은, 나타낸 도메인들 사이의 영역이 당해 용매 접근가능한 루프내에서 사용될 수 있는 많은 가능한 삽입 부위에 허용성인지를 측정하였다. 상기 공급원에 따라서, 도 14에서 보존된 잔기의 특정의 특징은 다음과 같이 나타난다: 박스쳐진 아미노산, 표준 스플라이싱 반응에서 친핵체; 상부경우 문자, 표준 인테인에서 보존된 아미노산; 하부경우 문자, 변형된 메카니즘에 의해 스플라이싱될 수 있는 다합체성 인테인내 아미노산.We have found that inteins can be modified by inserting peptides or large proteins. Preferably, insertion is made into a solvent accessible loop. By analyzing the sequence alignment of several inteins with structural modeling, we found that solvent accessible loops in both the Pyrococcus abici (PAB) LON intein and Pyrococcus puriosus (PFU) LON intein Confirmed. This loop was located between the endonuclease (H) domain motif and the F / G block of the intein (FIG. 14). FIG. 14 shows certain structural motifs of intein with respect to the location of the preferred location (dashed arrow) of the solvent accessible loop between the H and F / G blocks for the introduction of the insert comprising the tag (see: Information available on the Internet website, http://tools.neb.com/inbase/motifs_endo .php (InBase, The Intein Database: DOD Homing Endonuclease Motifs; InBase Reference: Perler, FB, 2002, InBase, the Intein Database, Nucleic Acids Res. 30, 383-384) (Schematic source showing specific intein structural features, including motifs.) The inventors have found that there are many possible ways in which the regions between the domains shown can be used in the solvent accessible loop. It was determined whether the insertion site was acceptable.According to the above sources, certain features of the conserved residues in Figure 14 appear as follows: boxed amino acids, nucleophiles in standard splicing reactions. Sieve; amino acids conserved in the standard intein, upper characters in the lower case, amino acids in the multimeric intein, which can be spliced by a modified mechanism.

부위 지시된 돌연변이유발을 사용하여, 본 발명자들은 당해 루프내 폴리히스티딘 친화성 태그를 삽입하고 이들 인테인이 기능하는 능력을 시험하였다. IHT는 자가-프로세싱하기 위한 PAB-LON 또는 PFU-LON 인테인 능력을 파괴하지 않으며, 폴리히스티딘 태그를 사용하여 단백질을 정제할 수 있으므로, 루프가 용매 접근가능함을 입증한다. 또한, PFU-RIR1-1 구조의 결정 구조의 실험은, 어떠한 단백질도, 이들이 실질적으로 또는 완전히 아미노 말단 및 카복실 말단 자가-촉매 반응을 파괴하지 않는 한, 당해 영역내에 삽입될 수 있음을 제안한다. 예를 들면, 아미노 및 카복시 말단 잔기를 매우 근접하게 갖는 폴리펩타이드 태그 또는 단백질은 인테인의 자가촉매분해적 활성을 실질적으로 파괴하지 않아야 한다. 바람직한 양태에서, 태그와 같은 삽입체를 갖는 작제물이 제공되며, 여기서, 작제물은 하나 이상의 목적하는 인테인 활성(예를 들면, 절단 및/또는 연결)을 나타낼 수 있다. 따라서, 인테인의 당해 용매 접근가능한 루프를 포함하는 작제물 성분들을 변형시켜 많은 상이한 기능성 분자를 생성할 수 있다.Using site directed mutagenesis, we inserted polyhistidine affinity tags in the loop and tested their ability to function. IHT does not destroy the ability of PAB-LON or PFU-LON intein to self-process and can purify proteins using polyhistidine tags, demonstrating that the loop is solvent accessible. In addition, experiments with the crystal structure of the PFU-RIR1-1 structure suggest that any protein can be inserted into the region as long as they do not substantially or completely disrupt the amino and carboxyl terminal self-catalytic reactions. For example, a polypeptide tag or protein having very close amino and carboxy terminal residues should not substantially destroy the autocatalytic activity of the intein. In a preferred embodiment, a construct is provided having an insert, such as a tag, wherein the construct can exhibit one or more desired intein activities (eg, cleavage and / or linkage). Thus, construct components comprising the corresponding solvent accessible loop of intein can be modified to produce many different functional molecules.

Pfu lon 인테인의 경우, 태그 서열을 삽입하였다. 삽입을 위한 바람직한 위치는, 삽입 부위의 상부의 아미노산 서열이 IEFIP(AA 323-327)이고 삽입 부위의 하부가 ISFSP(AA 328-332)인 경우이다. Pab lon 인테인의 경우, 태그 서열이 삽입되었다. 삽입을 위한 바람직한 위치는, 삽입 위치의 하부의 아미노산 서열이 IIFDA (AA 291-295)이고 삽입 부위의 하부가 GRLDV(AA 296-300)인 경우이다. Pfu lon 및 Pab lon 인테인 작제물 각각에서, 삽입된 태그 서열은 다음을 포함하였다: HHHHHH (서열 번호 56), HHHHHHHHHH (서열 번호 57), 및 HQHQHQ (서열 번호 58). 후자의 태그 서열(여기서 H는 히스티딘이고 Q는 글루타민이다)에 의해 입증되는 바와 같이, 삽입체는 폴리히스티딘 태그 이외의 것일 수 있다. 추가의 삽입체 서열을 당해 분야에서 이해되는 바와 같이 사용할 수 있다.For the Pfu lon intein, tag sequences were inserted. Preferred positions for insertion are where the amino acid sequence at the top of the insertion site is IEFIP (AA 323-327) and the bottom of the insertion site is ISFSP (AA 328-332). In the case of Pab lon intein, tag sequences were inserted. Preferred positions for insertion are where the amino acid sequence at the bottom of the insertion site is IIFDA (AA 291-295) and the bottom of the insertion site is GRLDV (AA 296-300). In each of the Pfu lon and Pab lon intein constructs, the inserted tag sequences included: HHHHHH (SEQ ID NO: 56), HHHHHHHHHH (SEQ ID NO: 57), and HQHQHQ (SEQ ID NO: 58). As evidenced by the latter tag sequence, where H is histidine and Q is glutamine, the insert may be other than a polyhistidine tag. Additional insert sequences can be used as understood in the art.

IHT-변형된 인테인 sORF 작제물은 IHT 변형없이 이들과 유사한 항체 분비 농도를 수득하였다. 당해 결과는, IHT 변형이 sORF 생성물의 이의 자가-프로세싱에 있어서 기능하기 위한 인테인의 능력을 파괴하지 않을 뿐 아니라, IHT가 배지내로 분비되는 것으로부터 정확하게 프로세싱된 항체를 방지하지 않음을 말한다.IHT-modified intein sORF constructs yielded antibody secretion concentrations similar to these without IHT modification. The results indicate that IHT modification not only destroys the ability of intein to function in its self-processing of the sORF product, but also does not prevent correctly processed antibodies from secreting IHT into the medium.

본 발명자들은, 고정된 금속 친화성 크로마토그래피를 사용하여, 오염물을 함유하는 인테인이 IHT를 통해 단백질 A 정제된 항체 제제로부터 신속하고 효율적으로 제거될 수 있음을 입증하였다. 이들 IHT 작제물은, 본 발명자들이 정확하게 프로세싱된 항체를 분리할 수 있도록 하며 치료용 항체를 포함하는 sORF-기원한 생물제의 생산을 위한 보충 방법을 나타낸다.Using fixed metal affinity chromatography, we demonstrated that inteins containing contaminants can be removed quickly and efficiently from Protein A purified antibody preparations via IHT. These IHT constructs enable the inventors to isolate correctly processed antibodies and represent supplemental methods for the production of sORF-derived biologics comprising therapeutic antibodies.

내부적으로 His-태그된 sORF 작제물을 사용하여, D2E7 항체 분자를 니켈 컬럼 크로마토그래피의 기술을 사용한 방식을 통한 유동중 인테인-함유 단백질 종으로부터 효율적으로 분리하였다. 유사하게, Pab lon HL(-) 작제물을 사용하여 생산된 D2E7 항체를 또한 Q-컬럼을 사용하여 인테인-함유 단백질 종으로부터 효율적으로 분리하였다. 단백질 A 기술에 의해 정제된 Pab lon HL(-)로부터 생산한 IgG 시료, 및 Pab lon HL(-)/10 His 작제물로부터 생산하고 proA 및 Ni-수지 둘다로 정제한 IgG 시료를 또한 SEC 분획화로 분석하였다. 정제 후 시료는 단량체성 IgG 종의 개선된 순도를 나타내었다. 크기 배제 크로마토그래피(SEC)로 추가로 잔류하는 약간의 오염물을 제거하였다. 정제된 IgG 시료를 BiaCore에 의해 특이적인 항원, TNFα에 대한 결합 친화성에 대해 분석하였다. 이들 시료의 친화성은 통상의 벡터를 사용하여 생산한 D2E7 항체와 구별가능하지 않았다.
Using internally His-tagged sORF constructs, D2E7 antibody molecules were efficiently separated from the intein-containing protein species in flow through the technique using nickel column chromatography. Similarly, D2E7 antibodies produced using Pab lon HL (−) constructs were also efficiently isolated from intein-containing protein species using Q-columns. IgG samples produced from Pab lon HL (-) purified by Protein A technology, and IgG samples produced from both Pab lon HL (-) / 10 His constructs and purified with both proA and Ni-resins were also subjected to SEC fractionation. Analyzed. The sample after purification showed improved purity of the monomeric IgG species. Size exclusion chromatography (SEC) further removed some remaining contaminants. Purified IgG samples were analyzed for binding affinity for specific antigen, TNFα by BiaCore. The affinity of these samples was indistinguishable from D2E7 antibodies produced using conventional vectors.

실시예 8. Pho lon 인테인Example 8 Pho lon Inteins

파이로코쿠스 호리코시이 OT3의 Pho lon 인테인에 대한 아미노산 서열을 하기 나타낸다. 또한 Inbase, NEB 인테인 데이타베이스에 따른 NCBI/단백질, PH0452내 수탁번호 제BAA29538.1호를 참조한다.The amino acid sequence for the Pho lon intein of Pyrococcus horicosyl OT3 is shown below. See also Inbase, NCBI / Protein according to the NEB intein database, accession number BAA29538.1 in PH0452.

Figure pct00025
Figure pct00025

실시예Example 9. 벡터 및  9. Vectors and 경쇄Light chain 시그날Signal 펩타이드Peptide ..

단백질의 발현을 위한 단일의 전사 해독 프레임 벡터와 관련하여 추가의 진전이 이루어졌다. 양태들에서, 벡터들은 포유동물 세포내에서 발현을 위한 면역글로불린의 단백질을 사용한다. 이러한 벡터에서, 경쇄 시그날 펩타이드를 포함하는 경쇄 성분들의 성분들의 구조를 설계하고 생성한다.Further progress has been made in connection with a single transcription translation frame vector for expression of the protein. In aspects, the vectors use proteins of immunoglobulins for expression in mammalian cells. In such vectors, the structure of the components of the light chain components, including the light chain signal peptide, are designed and generated.

단일의 전사 해독 프레임 작제물의 양태에서, 천연의 사람 항체 경쇄 공급원으로부터의 시그날 펩타이드를 사용한다. 예를 들면, 사람 경쇄 시그날 펩타이드가 V BASE에서 보고되어 있으며, 이는 진 뱅크(Genbank) 및 EMBL 데이타 라이브러리와 같은 공급원으로부터 사람 배선 가변 영역 서열에 있어서의 정보의 데이타베이스를 포함한다. V BASE 데이타베이스는 영국 캠브릿지 소재의 단백질 가공을 위한 MRC 센터(MRC Centre for Protein Engineering)(인터넷 주소로 사용가능, http://vbase. mrc-cpe. cam. ac. uk/)와 제휴되어 있다[또한, 참조: Giudicelli V et al., Nucleic Acids Research, 2006, Vol. 34, Database issue D781-D784; Retter I et al., Nucleic Acids Res. 2005 January 1 ; 33(Database Issue): D671 -D674]. 특수 양태에서, 천연의 아미노산을 포함하는 각종 아미노산을 지닌 IgG1항체를 생산하는데 사용될 수 있는 다수의 벡터 설계를 제공한다.In an embodiment of a single transcription translation frame construct, signal peptides from natural human antibody light chain sources are used. For example, human light chain signal peptides have been reported in V BASE, which includes a database of information in human germline variable region sequences from sources such as Genbank and EMBL data libraries. The V BASE database is affiliated with the MRC Center for Protein Engineering (available via the Internet at http://vbase.mrc-cpe.cam.ac.uk/) for protein processing in Cambridge, UK. [See also, Giudicelli V et al., Nucleic Acids Research, 2006, Vol. 34, Database issue D781-D784; Retter I et al., Nucleic Acids Res. 2005 January 1; 33 (Database Issue): D671-D674]. In particular embodiments, a number of vector designs are provided that can be used to produce IgGl antibodies having various amino acids, including naturally occurring amino acids.

일반적으로 19 내지 23개 아미노산 길이의 범위인 특정 사람 경쇄 시그날 펩타이드가 제공되며 하기 표(들)에 나타낸 서열을 갖는다(Hu Vk, 사람 카파 가변 영역; LCSP, 경쇄 시그날 펩타이드). 이러한 사람 기원을 포함하는 천연의 펩타이드와 관련하여 아미노산 서열 및/또는 길이가 변할 수 있는 변이체 펩타이드가 또한 제공된다. 제공된 아미노산 서열의 경우, 갭을 하나 이상의 다른 서열과의 정렬과 관련한 비교 목적을 위해 나타낼 수 있다. 양태에서, 제공된 경쇄 시그날 펩타이드 또는 이에 대해 암호화하는 핵산 서열이 제공된다. 하나의 양태에서, 아미노산 또는 핵산 서열이 발현 벡터, 합성된(천연적으로 합성된 바와 같은) 분자, 또는 재조합체 발현 생성물과 같은 서열 또는 이의 분절의 합성 작제물로서 제공된다.Certain human light chain signal peptides, generally ranging from 19 to 23 amino acids in length, are provided and have the sequences shown in the following table (s) (Hu Vk, human kappa variable region; LCSP, light chain signal peptide). Variant peptides are also provided which may vary in amino acid sequence and / or length in connection with natural peptides comprising such human origin. In the case of provided amino acid sequences, gaps may be indicated for comparison purposes with respect to alignment with one or more other sequences. In an aspect, provided light chain signal peptides or nucleic acid sequences encoding thereto are provided. In one embodiment, an amino acid or nucleic acid sequence is provided as a synthetic construct of an expression vector, a synthesized (as naturally synthesized) molecule, or a sequence such as a recombinant expression product or a segment thereof.

Figure pct00026
Figure pct00026

Figure pct00027
Figure pct00027

특정의 V카파 시그날 펩타이드를 E7으로 지명된 면역글로불린 경쇄(종양 괴사 인자 알파에 대해 항원 특이성을 갖는 항체 분자 D2E7의 경쇄에 상응)에 대한 시그날 펩타이드인, L5로 치환하였다. 또한, L5의 특정의 돌연변이체의 돌연변이 라이브러리를 작제하고, 돌연변이체 L5 펩타이드를 천연의 L5 펩타이드에 대해 치환하였다. 포유동물 발현 벡터를 파이로코쿠스 아비씨 lon 인테인을 사용하여 HL 오리엔테이션(orientation)으로 작제하였다. 다음 벡터를 생성하였다: pTT3-A14-E7-PablonHL, pTT3-A17-E7-PablonHL, pTT3-A18-E7-PablonHL, pTT3-A19-E7-PablonHL, pTT3-A23-E7-PablonHL, pTT3-A26-E7-PablonHL, pTT3-A27-E7-PablonHL, pTT3-B2-E7-PablonHL, pTT3-B3-E7-PablonHL, pTT3-L2-E7-PablonHL, pTT3-L20-E7-PablonHL, pTT3-L25-E7-PablonHL, pTT3-mut-1R-E7-PablonHL, pTT3-mut-1R2G-E7-PablonHL, pTT3-mut-2R-E7-PablonHL, pTT3-mut-2G-E7-PablonHL, pTT3-mut-2R2G-E7-PablonHL, pTT3-mut-3G-E7-PablonHL, pTT3-mut-3R2G-E7-PablonHL, pTT3-mut-4G-E7-PablonHL, pTT3-mut-H+2G-E7-PablonHL. 이들 작제물은 PTT3 벡터 골격상에서 제조하였다. 당해 벡터는 현탁액 배양물 속에서 형질감염된 293E 세포(엡슈타인-바르 바이러스 핵 항원 1을 발현하는 세포) 내에서 이의 에피솜 증폭을 허용하는 EBV 복제 오리진을 갖는다. 각각의 벡터는 CMV 프로모터에 의해 구동된, 1개의 ORF를 가졌다. ORF에서, 인테인 서열을 항체 중쇄 및 경쇄 사이의 프레임내에, HC-인테인-LC의 순서로 삽입하였다. pTT3-A18-E7-PablonHL에 대한 작제물 구조의 개략도는 도 15에 도시한다.Certain Vkappa signal peptides were substituted with L5, the signal peptide for the immunoglobulin light chain named E7 (corresponding to the light chain of antibody molecule D2E7 with antigen specificity for tumor necrosis factor alpha). In addition, mutation libraries of specific mutants of L5 were constructed and mutant L5 peptides were substituted for native L5 peptides. Mammalian expression vectors were constructed by HL orientation using the Pyrococcus acci lon intein. The following vectors were generated: pTT3-A14-E7-PablonHL, pTT3-A17-E7-PablonHL, pTT3-A18-E7-PablonHL, pTT3-A19-E7-PablonHL, pTT3-A23-E7-PablonHL, pTT3-A26- E7-PablonHL, pTT3-A27-E7-PablonHL, pTT3-B2-E7-PablonHL, pTT3-B3-E7-PablonHL, pTT3-L2-E7-PablonHL, pTT3-L20-E7-PablonHL, pTT3-L25-E7- PablonHL, pTT3-mut-1R-E7-PablonHL, pTT3-mut-1R2G-E7-PablonHL, pTT3-mut-2R-E7-PablonHL, pTT3-mut-2G-E7-PablonHL, pTT3-mut-2R2G-E7- PablonHL, pTT3-mut-3G-E7-PablonHL, pTT3-mut-3R2G-E7-PablonHL, pTT3-mut-4G-E7-PablonHL, pTT3-mut-H + 2G-E7-PablonHL. These constructs were prepared on a PTT3 vector backbone. The vector has an EBV replication origin that allows episomal amplification thereof in 293E cells (cells expressing Epstein-Barr virus nuclear antigen 1) transfected in suspension culture. Each vector had one ORF, driven by a CMV promoter. In the ORF, the intein sequence was inserted in the frame between the antibody heavy and light chains in the order of HC-intein-LC. A schematic of the construct structure for pTT3-A18-E7-PablonHL is shown in FIG. 15.

작제물을 일시적인 형질감염을 통해 293E 세포내로 도입시키고, 다수의 일시적인 발현 실험을 수행하였다. 제공된 실험에서, 시료를 형질감염 후 8일째에 형질감염된 세포의 배양물의 상층액으로부터 수집하고 분석하였다. IgG ELISA에 의해 평가한 것으로서 분비된 항체의 농도를 함유한 시료는 시료 ml당 항체의 마이크로그람으로 하기 표에 나타낸다. 천연의 대조군은 L5 LCSP 서열에 사용된 벡터였다. 다른 대조군(표에는 나타내지 않음)으로서, 동일한 항체를 발현하고, 동일한 조절 성분을 사용하는 통상의 2개의 벡터 시스템은 이들 실험으로 포함되었으며; 당해 대조군 벡터 시스템으로부터 생산된 항체 분비 농도는 80 내지 206㎍/ml이었다. 이들 경쇄 시그날 펩타이드를 사용한 sORF 작제물 설계 중 몇개에 의해 생산된 IgG 분비 농도는 통상의 벡터를 사용하여 생산된 범위의 순서로 비교가능하다. 이들 발현 수준은 천연의 L5 E7 시그날 펩타이드를 사용한 것보다 유의적으로 더 높다(Pablon HL(+) 작제물을 사용하여 2.0㎍/ml). 이들 항체 분비 농도는 또한 포유동물 세포에서 1.6㎍/ml인 것으로 보고된 "2A" 기술을 사용하여 생산된 것보다 유의적으로 더 높다(참조: Fang et al., 2005, Nature Biotechnology 23:584-590). The construct was introduced into 293E cells via transient transfection and a number of transient expression experiments were performed. In the experiments provided, samples were collected and analyzed from the supernatants of cultures of transfected cells 8 days after transfection. Samples containing the concentration of antibody secreted as assessed by IgG ELISA are shown in the table below with micrograms of antibody per ml of sample. The natural control was the vector used for the L5 LCSP sequence. As another control (not shown in the table), two conventional vector systems expressing the same antibody and using the same regulatory components were included in these experiments; The antibody secretion concentration produced from this control vector system was 80-206 μg / ml. IgG secretion concentrations produced by some of the sORF construct designs using these light chain signal peptides are comparable in the order of range produced using conventional vectors. These expression levels are significantly higher than those using native L5 E7 signal peptide (2.0 μg / ml using the Fablon HL (+) construct). These antibody secretion concentrations are also significantly higher than those produced using the "2A" technique reported to be 1.6 μg / ml in mammalian cells (Fang et al., 2005, Nature Biotechnology 23: 584- 590).

Figure pct00028
Figure pct00028

항체 생성물 농도를 측정한 명시된 작제물들 중에서, 최대 농도로 분비된 항체를 생산한 작제물 중 5개로부터의 생성물을 추가의 분석을 위해 선택하였다. 생성물은 다음 5개 작제물에 상응하였다: pTT3-A17-E7-PablonHL, pTT3-A18-E7-PablonHL, pTT3-A19-E7-PablonHL, pTT3-A26-E7-PablonHL, 및 pTT3-mutH+2G-E7-PablonHL. 이들 작제물로부터 생산된 분비된 항체를 단백질 A 친화성 크로마토그래피로 정제하고 환원 SDS-PAGE 겔 상에서 분석하고, 이들의 HC 및 LC에 대한 N-말단 아미노산 서열을 측정하였다. pTT3-A18-E7-PablonHL을 사용하여 생산한 시료는 전통적인 방법에 의해 생산한 유사한 항체와는 구별되지 않는 이동으로 항체 중쇄 및 경쇄에 상응하는 단백질 이동 밴드를 함유하였다. 환원 겔 상에서, 항체 HC 및 LC에 상응하는 밴드 외에, 프로세싱되지 않은 3부 단백질(HC-인테인-LC)에 상응하는 것으로 나타나는 2개의 고 분자량 밴드가 또한 존재하였다. 프로세싱되지 않거나 부분적으로 프로세싱된 단백질과 같은 이러한 작제물-관련 오염물은 본원에 기술된 바와 통상의 기술에 따라 편리하게 제거할 수 있다. SDS-PAGE 분석으로부터의 결과의 예를 도시하는 도 16을 참조한다. 분비된 IgG 항체를 단백질 A 친화성 크로마토그래피로 정제하고 환원 조건하에서 겔 속에서 SDS-PAGE의 기술을 사용하여 분리하였다. 좌측으로부터 우측까지 레인내 시료는 다음과 같다: 레인 (1) SeeBlue Plus2 단백질 표준물[제조원; 인비트로겐(Invitrogen)] 단백질 분자량 마커; (2) 대조군, 전통적인 비-sORF 발현 벡터 시스템으로 생산된 D2E7 항체; (3) Pab-lon HL(-); (4) pTT3-A18-E7-PablonHL.Of the specified constructs for which antibody product concentrations were measured, products from five of the constructs that produced antibodies secreted at maximum concentration were selected for further analysis. The product corresponded to the following five constructs: pTT3-A17-E7-PablonHL, pTT3-A18-E7-PablonHL, pTT3-A19-E7-PablonHL, pTT3-A26-E7-PablonHL, and pTT3-mutH + 2G- E7-PablonHL. Secreted antibodies produced from these constructs were purified by Protein A affinity chromatography and analyzed on a reducing SDS-PAGE gel and the N-terminal amino acid sequences for their HC and LC were determined. Samples produced using pTT3-A18-E7-PablonHL contained protein transfer bands corresponding to the antibody heavy and light chains in a shift indistinguishable from similar antibodies produced by conventional methods. On the reducing gel, in addition to the bands corresponding to the antibodies HC and LC, there were also two high molecular weight bands which appeared to correspond to the unprocessed 3-part protein (HC-intein-LC). Such construct-related contaminants, such as unprocessed or partially processed proteins, can be conveniently removed in accordance with conventional techniques as described herein. Reference is made to FIG. 16 which shows an example of the results from the SDS-PAGE analysis. Secreted IgG antibodies were purified by Protein A affinity chromatography and separated using a technique of SDS-PAGE in a gel under reducing conditions. Samples in lanes from left to right are as follows: Lane (1) SeeBlue Plus2 protein standard [manufacturer; Invitrogen] protein molecular weight markers; (2) control, D2E7 antibody produced with a traditional non-sORF expression vector system; (3) Pab-lon HL (−); (4) pTT3-A18-E7-PablonHL.

발현 작제물의 생성물의 세포내 시료를 또한 HC 및 LC 둘다에 대한 항체를 사용하여 웨스턴 블롯 분석으로 분석하였다. 유사한 단백질 종을 배양된 상층액 에서와 같이 관찰하였다. 중쇄 및 경쇄 둘다의 N-말단 아미노산 서열은 질량 분광법 분석에 의해 천연적인 것으로 측정되었다. A18 시그날 펩타이드 절단이 경쇄의 발현에 바람직한 정확한 지점에서 정밀하게 일어났음을 상기 분석으로 확인하였다. 또한, 전체 표면 전하를 기준으로 단백질을 분리하며 D2E7의 변이체 및 분순물을 검출할 수 있는 양이온 교환 크로마토그래피 (CIEX)를 사용하여 전통적으로 발현된 D2E7에 대한 유사성을 입증하였다. 따라서, A18 시그날 펩타이드를 항체 발현을 위한 sORF 벡터에 사용할 수 있으며 완전하게 프로세싱되고 조립된 항체 생성물을 효율적으로 발현시킬 수 있다.Intracellular samples of the product of the expression construct were also analyzed by Western blot analysis using antibodies against both HC and LC. Similar protein species were observed as in cultured supernatants. The N-terminal amino acid sequences of both heavy and light chains were determined to be natural by mass spectrometry analysis. The analysis confirmed that the A18 signal peptide cleavage occurred precisely at the exact point desired for expression of the light chain. In addition, similarity to traditionally expressed D2E7 was demonstrated using cation exchange chromatography (CIEX), which separates proteins based on total surface charge and can detect variants and impurities of D2E7. Thus, A18 signal peptides can be used in sORF vectors for antibody expression and can efficiently express fully processed and assembled antibody products.

상기에서 기술한 일시적인 발현 시스템 외에, 안정한 세포주를 또한 항체 생성물의 발현을 위해 생성시켰다. 안정한 CHO 세포주를 A18 경쇄 시그날 펩타이드 성분을 갖는 벡터를 사용하여 sORF 발현 작제물로 제조하였다. sORF 작제물 A18-E7-PablonHL을 플라스미드 pA190내로 재조합체 기술을 사용하여 클로닝하였다. pBJ-A18-LC-Pablon-HL(또한 pA190-A18-E7-PablonHL로서 언급됨)에 대한 작제물 구조의 개략도를 제공하는 도 18을 참조한다. 당해 작제물을 인산칼슘 방법에 의해 CHO B3.2 세포내로 형질감염시키고 5% FBS가 들어있는 최소 필수 배지(MEM) 알파 배지 속에서 48개의 96-웰 플레이트내로 플레이팅하였다. 형질감염 시료를 스크리닝하고 100 nM 이하의 MTX를 사용한 증폭 방법에 적용시켰다. 배양물 중 작제물의 발현 결과를 특성화하였다. 100 nM MTX에서, 작제물 pA190-A18-E7-PablonHL을 가진 세포는 배양물 상층액의 시료 속에서 1.1 내지 16.9 ㎍/ml 범위의 항체를 발현하였다. 4개의 최대 발현하는 클론을 제한 희석으로 아클로닝하였다. 아클론(subclone)을 시험하여 항체를 2.9 내지 31.8 ㎍/ml의 양으로 발현함을 발견하였다. 최대 발현 수준을 갖는 아클로닝된 세포 주 중 4개를 현탁액 속에서 성장하도록 적응시켰고 배양 4일 째에 수집한 시료로부터 측정된 것으로서 평균 31 내지 44 ㎍/ml의 양을 생산시켰다.In addition to the transient expression systems described above, stable cell lines were also generated for expression of antibody products. Stable CHO cell lines were prepared as sORF expression constructs using vectors with A18 light chain signal peptide components. sORF construct A18-E7-PablonHL was cloned into plasmid pA190 using recombinant technology. See FIG. 18 which provides a schematic of the construct structure for pBJ-A18-LC-Pablon-HL (also referred to as pA190-A18-E7-PablonHL). The constructs were transfected into CHO B3.2 cells by the calcium phosphate method and plated into 48 96-well plates in minimal essential medium (MEM) alpha medium containing 5% FBS. Transfection samples were screened and subjected to amplification methods with MTX of 100 nM or less. The expression results of the constructs in the cultures were characterized. At 100 nM MTX, cells with construct pA190-A18-E7-PablonHL expressed antibodies ranging from 1.1 to 16.9 μg / ml in samples of the culture supernatant. Four maximal expressing clones were cloned at the limiting dilution. Subclone was tested and found to express the antibody in an amount of 2.9 to 31.8 μg / ml. Four of the cloned cell lines with maximum expression levels were adapted to grow in suspension and produced an average amount of 31-44 μg / ml as measured from samples collected on day 4 of culture.

성숙한 경쇄 생성물을 생성하기 위한 작제물의 능력을 평가하였다. 웨스턴 블롯 실험으로부터의 결과를 제공하는 도 17을 참조한다. 세포내 항체 생성물의 시료를 특성화하였다. 전체 세포 분해물을 환원 조건하에서 겔 속에서 SDS-PAGE에 따라 분리하고, 니트로셀룰로즈 막으로 이전시키고, 차단 용액(TTBS중 탈지 분유, 트윈 20이 들어있는 트리스-완충된 염수)으로 차단하고, 중쇄 또는 경쇄에 대한 서양 고추냉이 퍼옥시다제-접합된 항체와 함께 항온처리하고 ECL(향상된 화학발광성) 시약을 사용하여 현상하였다. 블롯내 좌측으로부터 우측까지 레인내 작제물 지명에 따른 시료는 다음과 같다: 좌측에서 수를 세지않은 레인, 분자량 마커; (레인 1) 대조군, CHO 세포로부터 D2E7; (2) HEK293 세포을 사용한 일시적 형질감염시 대조군, pTT3-A18-E7-PablonHL; 각각 클론 번호 1, 3, 7, 9, 12, 14, 18, 15, 및 13에 상응하는 pA190-A18-E7-PablonHL로부터 (3-11) 각종 클론. 문자 "a" 및 "b"로 표지한 화살표는 다음과 같이 발현 생성물을 나타낸다: (a) 상부 밴드, 시그날 펩타이드를 지닌 경쇄, 및 (b) 하부 밴드, 성숙한 경쇄. 성숙한 경쇄 생성물에서, 시그날 펩타이드는 절단되어, 전구체와 관련된 보다 적은 분자량을 지닌 생성물을 생성하였다. 당해 결과는, A18 경쇄 시그날 펩타이드 성분이 D2E7 항체의 것과 비교가능한 완전히 성숙한 경쇄 생성물을 발현하고 생산할 수 있음을 입증한다.
The ability of the construct to produce mature light chain product was evaluated. See FIG. 17, which provides results from Western blot experiments. Samples of intracellular antibody products were characterized. Whole cell lysates are separated according to SDS-PAGE in the gel under reducing conditions, transferred to nitrocellulose membranes, blocked with blocking solution (skim milk powder in TTBS, Tris-buffered saline containing Tween 20), heavy chain or It was incubated with horseradish peroxidase-conjugated antibody to the light chain and developed using ECL (enhanced chemiluminescent) reagent. Samples according to in-lane construct designation from left to right in the blot are: uncounted lanes on the left, molecular weight markers; (Lane 1) control, D2E7 from CHO cells; (2) control, transient transfection with HEK293 cells, pTT3-A18-E7-PablonHL; (3-11) various clones from pA190-A18-E7-PablonHL corresponding to clone numbers 1, 3, 7, 9, 12, 14, 18, 15, and 13, respectively. Arrows labeled with the letters “a” and “b” indicate expression products as follows: (a) upper band, light chain with signal peptide, and (b) lower band, mature light chain. In mature light chain products, the signal peptide was cleaved to produce a product with a lower molecular weight associated with the precursor. The results demonstrate that the A18 light chain signal peptide component can express and produce a fully mature light chain product comparable to that of the D2E7 antibody.

참조문헌 및 변이에 의한 혼입에 관한 설명References and explanations for incorporation by variation

어떠한 서열 목록 정보도 본 명세서의 일부로 고려된다.Any sequence listing information is considered part of this specification.

본 명세서 전체에서 언급된 모든 참조문헌들, 예를 들면, 허여되거나 등록된 특허 또는 등가물; 특허원 공보; 공개되지 않은 특허원을 포함하는 특허 서류; 및 비-특허 문헌 서류 또는 다른 공급 자료는, 참조에 의한 개별적인 혼입을 통해, 이의 전문이 본원에 참조로 인용된다. 인용된 문헌들 및 본원의 기재내용 사이의 어떠한 불일치가 존재하는 경우, 본원의 기재내용이 우선한다. 본원에 제공된 일부 참조 문헌은 정보, 예를 들면, 출발 물질의 공급원, 추가의 출발 물질, 추가의 시약, 추가의 합성 방법, 추가의 분석 방법, 추가의 생물학적 물질, 추가의 세포 및 본 발명의 추가의 용도에 관한 세부사항을 제공하기 위해 참조로 인용되어 있다.All references cited throughout this specification, such as issued or registered patents or equivalents; Patent application publications; Patent documents, including unpublished patent applications; And non-patent literature documents or other feedstocks are incorporated herein by reference in their entirety, through individual incorporation by reference. In the event of any inconsistency between the cited documents and the disclosure herein, the disclosure herein takes precedence. Some references provided herein provide information, such as, for example, a source of starting material, additional starting materials, additional reagents, additional synthetic methods, additional analytical methods, additional biological materials, additional cells, and additional inventions. It is incorporated by reference to provide details regarding its use.

본원에 언급된 모든 특허 및 공보는 본 발명이 속한 당해 분야의 숙련가의 수준의 지표이다. 본원에 인용된 참조 문헌들은 이들의 공개일 또는 출원일로서 당해 분야의 기술을 나타내며, 당해 정보는 필요할 경우, 선행 기술에 속하는 특수 양태들을 배제하기 위해 사용될 수 있음을 의도한다. 예를 들면, 물질의 조성이 본원에 청구되어 있는 경우, 출원인의 발명 전에 당해 분야에 공지되고 사용가능한 화합물, 예를 들면 가능한 기재내용이 본원에 인용된 참조 문헌에 제공된 화합물들은 본원에 청구된 물질의 조성내 포함되는 것으로 의도되지 않는다.All patents and publications mentioned herein are indicative of the level of skill in the art to which this invention belongs. The references cited herein refer to the art as their publication date or application date, and the information is intended to be used to exclude special aspects belonging to the prior art if necessary. For example, where the composition of a substance is claimed herein, compounds known and available in the art prior to the applicant's invention, such as those provided in the references for which the disclosure is cited herein, are those It is not intended to be included in the composition of.

본원에 대한 모든 첨부 또는 첨부들은 명세서 및/또는 도면의 일부로서 참조에 의해 인용된다.All attachments or attachments to the application are incorporated by reference as part of the specification and / or drawings.

화합물, 작제물 또는 조성물이 청구된 경우, 본원에 기재된 참조 문헌에 교시된 것들을 포함하는 당해 분야에 공지된 화합물, 작제물 및 조성물은 포함되지 않는 것으로 의도됨을 이해하여야 한다. 마르쿠쉬 그룹 또는 다른 그룹이 본원에 사용된 경우, 그룹의 모든 개개 구성원들 및 그룹내로부터 가능한 모든 조합 및 소조합은 또한 개별적으로 설정되어 있으며 기재내용에 포함된 것으로 의도된다.When a compound, construct or composition is claimed, it is to be understood that the compound, construct and composition known in the art, including those taught in the references described herein, is not intended to be included. Where a Markush group or other group is used herein, all individual members of the group and all possible combinations and subcombinations from within the group are also set individually and are intended to be included in the description.

용어 "포함하다(comprise, comprises)", "포함된", 또는 "포함하는"이 본원에 사용된 경우, 이들은 하나 이상의 다른 특징, 정수, 단계, 성분 또는 이들의 그룹의 존재 또는 첨가를 언급하나, 이를 배제하지 않는 기술된 특징, 정수, 단계 또는 성분들의 존재를 명시하는 것으로 해석되어야 한다. 따라서 본원에 사용된 것으로서, '포함하는'은 '포괄하는', '함유하는', '갖는' 또는 '에 의해 특징화되는'과 동의어이며 포괄적이거나 확장가능하고 추가의, 열거되지 않은 성분들 또는 방법 단계들을 배제하지 않는다. 본원에 사용된 것으로서, "로 이루어진"은 특허청구범위 기술에서 명시되지 않은 어떠한 성분, 단계 또는 성분 등도 배제한다. 본원에 사용된 것으로서, "으로 필수적으로 이루어진"은 특허청구의 범위의 기본적이고 신규한 특징(예를 들어, 활성 성분에 관련된)에 실질적으로 영향을 주지 않는 물질 또는 단계들을 배제하지 않는다. 본원의 각각의 예에서 용어 "포함하는", "으로 필수적으로 이루어진" 및 "로 이루어진" 중 어느 것도 적어도 다른 2개의 용어로 대체됨으로써 필수적으로 공존하지 않는 별개의 양태들 및/또는 영역들을 기재할 수 있다. 본원에 설명적으로 기술된 본 발명의 양태는 본원에 구체적으로 기재된 어떠한 성분 또는 성분들 또는 제한 또는 제한들의 부재시 적합하게 실시될 수 있다.When the terms “comprise, comprise”, “included”, or “comprising” are used herein, they refer to the presence or addition of one or more other features, integers, steps, components or groups thereof. It should be construed as indicating the presence of the described features, integers, steps or components without excluding them. Thus, as used herein, 'comprising' is synonymous with 'comprising', 'containing', 'having' or 'characterized by' and is comprehensive or extensible and further, not listed components or It does not exclude method steps. As used herein, “consisting of” excludes any ingredient, step or ingredient not specified in the claims. As used herein, “consisting essentially of” does not exclude substances or steps that do not substantially affect the basic and novel features of the claims (eg, related to the active ingredient). In each of the examples herein, any of the terms “comprising”, “consisting essentially of” and “consisting of” consists of distinct aspects and / or regions that do not necessarily coexist by being replaced by at least two other terms. Can be. Aspects of the invention described herein descriptively may be suitably practiced in the absence of any component or ingredients or limitations or limitations specifically described herein.

범위, 예를 들어, 온도 범위, 시간 범위, 조성물 또는 농도 범위, 또는 다른 값 범위 등이 본원에 기재되어 있는 경우에는 언제나, 모든 중간 범위 및 부범위 뿐만 아니라 제공된 범위에 포함된 모든 개개의 값들이 기재내용에 포함되는 것으로 의도된다. 본 발명은 실시예 또는 설명의 방식으로 제한하지 않으며 제공되는, 도면에 나타낸 또는 명세서에 예시된 어느 것도 포함하는, 기재된 양태들에 의해 한정되지 않는다. 본원의 기술내용에 포함된 범위 또는 소범위에서 어떠한 소범위 또는 개개 값도 본원의 특허청구범위로부터 배제될 수 있음은 이해될 것이다.Whenever a range, eg, a temperature range, a time range, a composition or concentration range, or other value range, is described herein, all individual values included in the provided ranges, as well as all intermediate and subranges, are It is intended to be included in the description. The present invention is not limited in the manner of examples or descriptions and is not limited by the described aspects, including any shown, illustrated in the drawings or illustrated in the specification. It is to be understood that any subrange or individual value in the range or subrange included in the description herein may be excluded from the claims herein.

본 발명은 각종 특이적이고/이거나 바람직한 양태 및 기술에 대한 참조 문헌과 함게 기술되어 있다. 그러나, 많은 변화 및 변형이 본 발명의 취지 및 영역내에서 이루어질 수 있음을 이해하여야 한다. 당해 분야의 통상의 기술자에게는, 본원에 구체적으로 기술된 것들 이외의 조성물들, 방법들, 장치들, 장치 성분들, 물질들, 과정들 및 기술들이 과도한 실험에 대한 의존없이도 본원에 광범위하게 기재된 것으로서 본 발명의 실시에 사용될 수 있으며; 이는 예를 들면, 출발 물질, 생물학적 물질, 시약, 합성 방법, 정제 방법, 분석 방법, 검사 방법 및 구체적으로 예시된 것들 외의 생물학적 방법에 확장될 수 있음이 명백할 것이다. 본원에 기술된 앞서의 모든 당해 분야에 공지된 기능적 등량체(예를 들어, 조성물, 방법, 장치, 장치 성분, 물질, 과정 및 기술 등)는 본 발명에 포함되는 것으로 의도된다. 사용된 용어들 및 표현들은 기술의 측면에서 사용되며 제한하지 않고, 나타내고 기술된 특징들의 어떠한 등가물 또는 이의 부분을 제외한 이러한 용어들 및 표현들의 사용을 의도하지 않지만, 각종 변형이 특허청구된 본 발명의 영역내에서 가능함이 인식된다. 따라서, 비록 본 발명이 양태들, 바람직한 양태들에 의해 구체적으로 기재되어 있다고 해도, 본원에 기재된 개념의 임의의 특징, 변형 및 변화는 당해 분야의 숙련가에 의해 재분류될 수 있으며, 이러한 변형 및 변화는 첨부된 특허청구범위에 의해 정의된 바와 같은 본 발명의 영역내에 있는 것으로 고려됨을 이해하여야 한다.
The present invention has been described with reference to various specific and / or preferred embodiments and techniques. However, it should be understood that many variations and modifications may be made within the spirit and scope of the invention. To those skilled in the art, compositions, methods, devices, device components, materials, processes and techniques other than those specifically described herein are described broadly herein without reliance on undue experimentation. Can be used in the practice of the present invention; It will be apparent that this may extend to, for example, starting materials, biological materials, reagents, synthetic methods, purification methods, analytical methods, assay methods and biological methods other than those specifically exemplified. All previous functional equivalents known in the art described herein (eg, compositions, methods, devices, device components, materials, processes and techniques, etc.) are intended to be included in the present invention. The terms and expressions used are used in terms of technology and are not intended to be limiting, and are not intended to be used with the terms and expressions other than any equivalent or part of the features shown and described, but various modifications of the invention claimed It is recognized that it is possible within the domain. Thus, although the invention is specifically described by its aspects, preferred embodiments, any feature, modification, and change of the concepts described herein may be reclassified by those skilled in the art and such modifications and changes Should be considered to be within the scope of the present invention as defined by the appended claims.

참조 문헌References

본원은 특히 다음 항목들 각각의 전문을 참조로 인용한다:
The present application is specifically cited by reference in its entirety in each of the following items:

Figure pct00029
Figure pct00029

Figure pct00030
Figure pct00030

Figure pct00031
Figure pct00031

Figure pct00032
Figure pct00032

SEQUENCE LISTING <110> ABBOTT LABORATORIES <120> SORF CONSTRUCTS AND MULTIPLE GENE EXPRESSION <130> 54-08 WO <150> US 61/256,544 <151> 2009-10-30 <160> 108 <170> KopatentIn 1.71 <210> 1 <211> 335 <212> PRT <213> Pyrococcus abyssi <400> 1 Gln Cys Phe Ser Gly Glu Glu Thr Val Val Ile Arg Glu Asn Gly Glu 1 5 10 15 Val Lys Val Leu Arg Leu Lys Asp Phe Val Glu Lys Ala Leu Glu Lys 20 25 30 Pro Ser Gly Glu Gly Leu Asp Gly Asp Val Lys Val Val Tyr His Asp 35 40 45 Phe Arg Asn Glu Asn Val Glu Val Leu Thr Lys Asp Gly Phe Thr Lys 50 55 60 Leu Leu Tyr Ala Asn Lys Arg Ile Gly Lys Gln Lys Leu Arg Arg Val 65 70 75 80 Val Asn Leu Glu Lys Asp Tyr Trp Phe Ala Leu Thr Pro Asp His Lys 85 90 95 Val Tyr Thr Thr Asp Gly Leu Lys Glu Ala Gly Glu Ile Thr Glu Lys 100 105 110 Asp Glu Leu Ile Ser Val Pro Ile Thr Val Phe Asp Cys Glu Asp Glu 115 120 125 Asp Leu Lys Lys Ile Gly Leu Leu Pro Leu Thr Ser Asp Asp Glu Arg 130 135 140 Leu Arg Lys Ile Ala Thr Leu Met Gly Ile Leu Phe Asn Gly Gly Ser 145 150 155 160 Ile Asp Glu Gly Leu Gly Val Leu Thr Leu Lys Ser Glu Arg Ser Val 165 170 175 Ile Glu Lys Phe Val Ile Thr Leu Lys Glu Leu Phe Gly Lys Phe Glu 180 185 190 Tyr Glu Ile Ile Lys Glu Glu Asn Thr Ile Leu Lys Thr Arg Asp Pro 195 200 205 Arg Ile Ile Lys Phe Leu Val Gly Leu Gly Ala Pro Ile Glu Gly Lys 210 215 220 Asp Leu Lys Met Pro Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu 225 230 235 240 Ala Phe Leu Glu Gly Phe Arg Ala His Ile Val Glu Gln Leu Val Asp 245 250 255 Asp Pro Asn Lys Asn Leu Pro Phe Phe Gln Glu Leu Ser Trp Tyr Leu 260 265 270 Gly Leu Phe Gly Ile Lys Ala Asp Ile Lys Val Glu Glu Val Gly Asp 275 280 285 Lys His Lys Ile Ile Phe Asp Ala Gly Arg Leu Asp Val Asp Lys Gln 290 295 300 Phe Ile Glu Thr Trp Glu Asp Val Glu Val Thr Tyr Asn Leu Thr Thr 305 310 315 320 Glu Lys Gly Asn Leu Leu Ala Asn Gly Leu Phe Val Lys Asn Ser 325 330 335 <210> 2 <211> 999 <212> DNA <213> Pyrococcus abyssi <400> 2 tgcttcagcg gcgaggaaac cgtggtgatc cgggagaacg gcgaggtgaa ggtgctgcgg 60 ctgaaggact tcgtggagaa ggccctggaa aagccctccg gcgagggcct ggacggcgac 120 gtgaaagtgg tgtaccacga cttccggaac gagaacgtgg aggtgctgac caaggacggc 180 ttcaccaagc tgctgtacgc caacaagcgg atcggcaagc agaaactgcg gcgggtggtg 240 aacctggaaa aggactactg gttcgccctg acccccgacc acaaggtgta caccaccgac 300 ggcctgaaag aggccggcga gatcaccgag aaggacgagc tgatcagcgt gcccatcacc 360 gtgttcgact gcgaggacga ggacctgaag aagatcggcc tgctgcccct gaccagcgac 420 gacgagcggc tgcggaagat cgccaccctg atgggcatcc tgttcaacgg cggcagcatc 480 gatgagggcc tgggcgtgct gaccctgaag agcgagcgga gcgtgatcga gaagttcgtg 540 atcaccctga aagagctgtt cggcaagttc gagtacgaga tcatcaaaga ggaaaacacc 600 atcctgaaaa cccgggaccc ccggatcatc aagtttctgg tgggcctggg agcccccatc 660 gagggcaagg atctgaagat gccttggtgg gtgaagctga agcccagcct gttcctggcc 720 ttcctggaag gcttccgggc ccacatcgtg gagcagctgg tcgacgaccc caacaagaat 780 ctgcccttct ttcaggaact gagctggtat ctgggcctgt tcggcatcaa ggccgacatc 840 aaggtggagg aagtgggcga caagcacaag atcatcttcg acgccggcag gctggacgtg 900 gacaagcagt tcatcgagac ctgggaggat gtggaggtga cctacaacct gaccacagag 960 aagggcaatc tgctggccaa cggcctgttc gtgaagaac 999 <210> 3 <211> 333 <212> PRT <213> Pyrococcus abyssi <400> 3 Cys Phe Ser Gly Glu Glu Thr Val Val Ile Arg Glu Asn Gly Glu Val 1 5 10 15 Lys Val Leu Arg Leu Lys Asp Phe Val Glu Lys Ala Leu Glu Lys Pro 20 25 30 Ser Gly Glu Gly Leu Asp Gly Asp Val Lys Val Val Tyr His Asp Phe 35 40 45 Arg Asn Glu Asn Val Glu Val Leu Thr Lys Asp Gly Phe Thr Lys Leu 50 55 60 Leu Tyr Ala Asn Lys Arg Ile Gly Lys Gln Lys Leu Arg Arg Val Val 65 70 75 80 Asn Leu Glu Lys Asp Tyr Trp Phe Ala Leu Thr Pro Asp His Lys Val 85 90 95 Tyr Thr Thr Asp Gly Leu Lys Glu Ala Gly Glu Ile Thr Glu Lys Asp 100 105 110 Glu Leu Ile Ser Val Pro Ile Thr Val Phe Asp Cys Glu Asp Glu Asp 115 120 125 Leu Lys Lys Ile Gly Leu Leu Pro Leu Thr Ser Asp Asp Glu Arg Leu 130 135 140 Arg Lys Ile Ala Thr Leu Met Gly Ile Leu Phe Asn Gly Gly Ser Ile 145 150 155 160 Asp Glu Gly Leu Gly Val Leu Thr Leu Lys Ser Glu Arg Ser Val Ile 165 170 175 Glu Lys Phe Val Ile Thr Leu Lys Glu Leu Phe Gly Lys Phe Glu Tyr 180 185 190 Glu Ile Ile Lys Glu Glu Asn Thr Ile Leu Lys Thr Arg Asp Pro Arg 195 200 205 Ile Ile Lys Phe Leu Val Gly Leu Gly Ala Pro Ile Glu Gly Lys Asp 210 215 220 Leu Lys Met Pro Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu Ala 225 230 235 240 Phe Leu Glu Gly Phe Arg Ala His Ile Val Glu Gln Leu Val Asp Asp 245 250 255 Pro Asn Lys Asn Leu Pro Phe Phe Gln Glu Leu Ser Trp Tyr Leu Gly 260 265 270 Leu Phe Gly Ile Lys Ala Asp Ile Lys Val Glu Glu Val Gly Asp Lys 275 280 285 His Lys Ile Ile Phe Asp Ala Gly Arg Leu Asp Val Asp Lys Gln Phe 290 295 300 Ile Glu Thr Trp Glu Asp Val Glu Val Thr Tyr Asn Leu Thr Thr Glu 305 310 315 320 Lys Gly Asn Leu Leu Ala Asn Gly Leu Phe Val Lys Asn 325 330 <210> 4 <211> 403 <212> PRT <213> Pyrococcus furiosus <400> 4 Gln Cys Phe Ser Gly Glu Glu Val Ile Leu Ile Glu Lys Asp Gly Glu 1 5 10 15 Lys Lys Val Phe Lys Leu Arg Glu Phe Val Asp Gly Leu Leu Lys Glu 20 25 30 Ala Ser Gly Glu Gly Met Asp Gly Ser Ile Arg Val Val Tyr Lys Asp 35 40 45 Leu Gln Gly Glu Asn Ile Lys Ile Leu Thr Lys Asp Gly Leu Val Lys 50 55 60 Leu Leu Tyr Val Asn Arg Arg Glu Gly Lys Gln Lys Leu Arg Lys Ile 65 70 75 80 Val Asn Leu Glu Lys Asp Tyr Trp Leu Ala Leu Thr Pro Glu His Lys 85 90 95 Val Tyr Thr Ile Lys Gly Leu Lys Glu Ala Gly Glu Ile Thr Lys Asp 100 105 110 Asp Glu Ile Ile Arg Val Pro Leu Thr Ile Leu Asp Gly Phe Asp Val 115 120 125 Ala Glu Lys Ser Ile Arg Glu Glu Leu Glu Arg Leu Ser Leu Leu Pro 130 135 140 Leu Asn Ser Glu Asp Ser Arg Leu Glu Lys Ile Ala Gly Ile Met Gly 145 150 155 160 Ala Leu Phe Gly Ser Gly Gly Ile Asp Glu Asn Leu Asn Thr Leu Ser 165 170 175 Phe Val Ser Ser Glu Lys Lys Thr Ile Glu Gln Phe Val Lys Ala Leu 180 185 190 Ser Glu Leu Phe Gly Glu Phe Asp Tyr Lys Ile Glu Glu Lys Glu Asn 195 200 205 Ser Ile Ile Phe Arg Thr Cys Asp Lys Arg Ile Val Thr Phe Phe Ala 210 215 220 Thr Leu Gly Ala Pro Val Gly Asp Lys Ser Lys Val Lys Leu Lys Leu 225 230 235 240 Pro Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu Ala Phe Met Asp 245 250 255 Gly Leu Tyr Ser Ser Asn Arg Asn Asp Lys Glu Ile Leu Glu Ile Thr 260 265 270 Gln Leu Thr Asp Asn Val Glu Thr Phe Phe Glu Glu Ile Ser Trp Tyr 275 280 285 Leu Ser Phe Phe Gly Ile Lys Ala Glu Ala Glu Glu Asp Glu Glu Lys 290 295 300 Asp Lys Tyr Arg Ala Arg Leu Thr Leu Ser Ser Ser Ile Asp Asn Met 305 310 315 320 Leu Asn Phe Ile Glu Phe Ile Pro Ile Ser Phe Ser Pro Ala Lys Arg 325 330 335 Glu Lys Phe Phe Lys Glu Ile Glu Lys Tyr Leu Glu Tyr Ser Ile Pro 340 345 350 Glu Lys Thr Glu Asp Leu Lys Lys Arg Val Lys Arg Val Lys Lys Gly 355 360 365 Glu Arg Arg Asn Phe Leu Glu Ser Trp Glu Glu Val Glu Val Thr Tyr 370 375 380 Asn Val Thr Thr Glu Thr Gly Asn Leu Leu Ala Asn Gly Leu Phe Val 385 390 395 400 Lys Asn Ser <210> 5 <211> 1203 <212> DNA <213> Pyrococcus furiosus <400> 5 tgttttagcg gtgaagaagt tatcttaatt gaaaaggacg gagagaaaaa agtcttcaaa 60 cttagggagt tcgttgacgg tctccttaag gaggcgtctg gagaagggat ggacggaagt 120 attagagtag tttataaaga tcttcaaggg gaaaacataa aaatactcac aaaagacgga 180 cttgtaaagc tcctttatgt caatagaaga gaagggaagc aaaagcttag aaaaatagta 240 aatcttgaaa aggattattg gcttgcatta acacctgaac ataaagtgta cacaataaag 300 ggccttaaag aagctggaga gataactaaa gatgatgaga taataagagt gcctctcaca 360 attcttgacg gctttgacgt agccgagaag agtataagag aggaacttga aaggcttagc 420 ctacttccac taaatagtga agacagtaga ctagaaaaga tagcaggaat catgggcgca 480 ctctttggta gtggaggtat cgatgagaat ctcaataccc ttagctttgt ttctagcgag 540 aagaaaacaa ttgaacagtt tgttaaagca ctcagcgagc tcttcgggga atttgactat 600 aaaattgaag aaaaagaaaa cagcattatt ttcagaacat gtgataaaag aatagtgacc 660 ttctttgcta cacttggtgc accagttgga gacaaaagca aagttaagct taagcttcca 720 tggtgggtca agcttaagcc gtcacttttc ctcgccttca tggatggtct ctacagtagc 780 aataggaatg acaaagaaat cctcgaaata actcaactta ctgacaacgt cgaaacgttc 840 ttcgaggaaa tatcttggta tctgagcttc tttggaatta aggcagaagc tgaagaggat 900 gaagaaaaag ataaatacag ggctagactt acgctatcct catcaataga caacatgctt 960 aatttcattg agttcattcc aataagcttt tctccagcaa agagagaaaa attctttaag 1020 gaaattgaaa aatatctgga atatagcatt cccgaaaaga ctgaggatct taagaaacga 1080 gttaagagag ttaagaaggg agagagaagg aatttcctcg aaagctggga ggaagttgaa 1140 gttacttaca acgtaactac agagacagga aatctacttg ctaacggtct atttgttaag 1200 aac 1203 <210> 6 <211> 401 <212> PRT <213> Pyrococcus furiosus <400> 6 Cys Phe Ser Gly Glu Glu Val Ile Leu Ile Glu Lys Asp Gly Glu Lys 1 5 10 15 Lys Val Phe Lys Leu Arg Glu Phe Val Asp Gly Leu Leu Lys Glu Ala 20 25 30 Ser Gly Glu Gly Met Asp Gly Ser Ile Arg Val Val Tyr Lys Asp Leu 35 40 45 Gln Gly Glu Asn Ile Lys Ile Leu Thr Lys Asp Gly Leu Val Lys Leu 50 55 60 Leu Tyr Val Asn Arg Arg Glu Gly Lys Gln Lys Leu Arg Lys Ile Val 65 70 75 80 Asn Leu Glu Lys Asp Tyr Trp Leu Ala Leu Thr Pro Glu His Lys Val 85 90 95 Tyr Thr Ile Lys Gly Leu Lys Glu Ala Gly Glu Ile Thr Lys Asp Asp 100 105 110 Glu Ile Ile Arg Val Pro Leu Thr Ile Leu Asp Gly Phe Asp Val Ala 115 120 125 Glu Lys Ser Ile Arg Glu Glu Leu Glu Arg Leu Ser Leu Leu Pro Leu 130 135 140 Asn Ser Glu Asp Ser Arg Leu Glu Lys Ile Ala Gly Ile Met Gly Ala 145 150 155 160 Leu Phe Gly Ser Gly Gly Ile Asp Glu Asn Leu Asn Thr Leu Ser Phe 165 170 175 Val Ser Ser Glu Lys Lys Thr Ile Glu Gln Phe Val Lys Ala Leu Ser 180 185 190 Glu Leu Phe Gly Glu Phe Asp Tyr Lys Ile Glu Glu Lys Glu Asn Ser 195 200 205 Ile Ile Phe Arg Thr Cys Asp Lys Arg Ile Val Thr Phe Phe Ala Thr 210 215 220 Leu Gly Ala Pro Val Gly Asp Lys Ser Lys Val Lys Leu Lys Leu Pro 225 230 235 240 Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu Ala Phe Met Asp Gly 245 250 255 Leu Tyr Ser Ser Asn Arg Asn Asp Lys Glu Ile Leu Glu Ile Thr Gln 260 265 270 Leu Thr Asp Asn Val Glu Thr Phe Phe Glu Glu Ile Ser Trp Tyr Leu 275 280 285 Ser Phe Phe Gly Ile Lys Ala Glu Ala Glu Glu Asp Glu Glu Lys Asp 290 295 300 Lys Tyr Arg Ala Arg Leu Thr Leu Ser Ser Ser Ile Asp Asn Met Leu 305 310 315 320 Asn Phe Ile Glu Phe Ile Pro Ile Ser Phe Ser Pro Ala Lys Arg Glu 325 330 335 Lys Phe Phe Lys Glu Ile Glu Lys Tyr Leu Glu Tyr Ser Ile Pro Glu 340 345 350 Lys Thr Glu Asp Leu Lys Lys Arg Val Lys Arg Val Lys Lys Gly Glu 355 360 365 Arg Arg Asn Phe Leu Glu Ser Trp Glu Glu Val Glu Val Thr Tyr Asn 370 375 380 Val Thr Thr Glu Thr Gly Asn Leu Leu Ala Asn Gly Leu Phe Val Lys 385 390 395 400 Asn <210> 7 <211> 333 <212> PRT <213> Pyrococcus abyssi <400> 7 Cys Phe Ser Gly Glu Glu Thr Val Val Ile Arg Glu Asn Gly Glu Val 1 5 10 15 Lys Val Leu Arg Leu Lys Asp Phe Val Glu Lys Ala Leu Glu Lys Pro 20 25 30 Ser Gly Glu Gly Leu Asp Gly Asp Val Lys Val Val Tyr His Asp Phe 35 40 45 Arg Asn Glu Asn Val Glu Val Leu Thr Lys Asp Gly Phe Thr Lys Leu 50 55 60 Leu Tyr Ala Asn Lys Arg Ile Gly Lys Gln Lys Leu Arg Arg Val Val 65 70 75 80 Asn Leu Glu Lys Asp Tyr Trp Phe Ala Leu Thr Pro Asp His Lys Val 85 90 95 Tyr Thr Thr Asp Gly Leu Lys Glu Ala Gly Glu Ile Thr Glu Lys Asp 100 105 110 Glu Leu Ile Ser Val Pro Ile Thr Val Phe Asp Cys Glu Asp Glu Asp 115 120 125 Leu Lys Lys Ile Gly Leu Leu Pro Leu Thr Ser Asp Asp Glu Arg Leu 130 135 140 Arg Lys Ile Ala Thr Leu Met Gly Ile Leu Phe Asn Gly Gly Ser Ile 145 150 155 160 Asp Glu Gly Leu Gly Val Leu Thr Leu Lys Ser Glu Arg Ser Val Ile 165 170 175 Glu Lys Phe Val Ile Thr Leu Lys Glu Leu Phe Gly Lys Phe Glu Tyr 180 185 190 Glu Ile Ile Lys Glu Glu Asn Thr Ile Leu Lys Thr Arg Asp Pro Arg 195 200 205 Ile Ile Lys Phe Leu Val Gly Leu Gly Ala Pro Ile Glu Gly Lys Asp 210 215 220 Leu Lys Met Pro Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu Ala 225 230 235 240 Phe Leu Glu Gly Phe Arg Ala His Ile Val Glu Gln Leu Val Asp Asp 245 250 255 Pro Asn Lys Asn Leu Pro Phe Phe Gln Glu Leu Ser Trp Tyr Leu Gly 260 265 270 Leu Phe Gly Ile Lys Ala Asp Ile Lys Val Glu Glu Val Gly Asp Lys 275 280 285 His Lys Ile Ile Phe Asp Ala Gly Arg Leu Asp Val Asp Lys Gln Phe 290 295 300 Ile Glu Thr Trp Glu Asp Val Glu Val Thr Tyr Asn Leu Thr Thr Glu 305 310 315 320 Lys Gly Asn Leu Leu Ala Asn Gly Leu Phe Val Lys Asn 325 330 <210> 8 <211> 999 <212> DNA <213> Pyrococcus abyssi <400> 8 tgcttcagcg gcgaggaaac cgtggtgatc cgggagaacg gcgaggtgaa ggtgctgcgg 60 ctgaaggact tcgtggagaa ggccctggaa aagccctccg gcgagggcct ggacggcgac 120 gtgaaagtgg tgtaccacga cttccggaac gagaacgtgg aggtgctgac caaggacggc 180 ttcaccaagc tgctgtacgc caacaagcgg atcggcaagc agaaactgcg gcgggtggtg 240 aacctggaaa aggactactg gttcgccctg acccccgacc acaaggtgta caccaccgac 300 ggcctgaaag aggccggcga gatcaccgag aaggacgagc tgatcagcgt gcccatcacc 360 gtgttcgact gcgaggacga ggacctgaag aagatcggcc tgctgcccct gaccagcgac 420 gacgagcggc tgcggaagat cgccaccctg atgggcatcc tgttcaacgg cggcagcatc 480 gatgagggcc tgggcgtgct gaccctgaag agcgagcgga gcgtgatcga gaagttcgtg 540 atcaccctga aagagctgtt cggcaagttc gagtacgaga tcatcaaaga ggaaaacacc 600 atcctgaaaa cccgggaccc ccggatcatc aagtttctgg tgggcctggg agcccccatc 660 gagggcaagg atctgaagat gccttggtgg gtgaagctga agcccagcct gttcctggcc 720 ttcctggaag gcttccgggc ccacatcgtg gagcagctgg tcgacgaccc caacaagaat 780 ctgcccttct ttcaggaact gagctggtat ctgggcctgt tcggcatcaa ggccgacatc 840 aaggtggagg aagtgggcga caagcacaag atcatcttcg acgccggcag gctggacgtg 900 gacaagcagt tcatcgagac ctgggaggat gtggaggtga cctacaacct gaccacagag 960 aagggcaatc tgctggccaa cggcctgttc gtgaagaac 999 <210> 9 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 9 Glu Val Gln Leu Val Glu Ser Gly Gly Gly 1 5 10 <210> 10 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 10 Met Glu Val Gln Leu Val Glu Ser Gly Gly 1 5 10 <210> 11 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 11 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser 1 5 10 <210> 12 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 12 Met Asp Ile Gln Met Thr Gln Ser Pro Ser 1 5 10 <210> 13 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 13 Ala Asn Gly Leu Phe Val Lys Asn 1 5 <210> 14 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 14 Met Arg Ala Lys Arg 1 5 <210> 15 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 15 His Ala Arg Gly Val Phe Arg Arg 1 5 <210> 16 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 16 Met Asp Arg Gly Val Phe Arg Arg 1 5 <210> 17 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 17 Asp Ile Gln Met Thr Gln Ser 1 5 <210> 18 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 18 Ala Ile Gln Met Thr Gln Ser 1 5 <210> 19 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 19 Asn Ile Gln Met Thr Gln Ser 1 5 <210> 20 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 20 Asn Phe Gln Met Thr Gln Ser 1 5 <210> 21 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 21 Met Asp Ile Gln Met Thr Gln Ser 1 5 <210> 22 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 22 Met Arg Ala Lys Arg Asp Ile Gln Met Thr Gln Ser 1 5 10 <210> 23 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 23 Tyr Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 24 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 24 Arg Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 25 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 25 Val Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 26 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 26 Gln Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 27 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 27 Ala Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 28 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 28 His Ala Asp Ile Gln Met Thr Gln Ser 1 5 <210> 29 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 29 Tyr Ala Asp Ile Gln Met Thr Gln Ser 1 5 <210> 30 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 30 Met Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 31 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 31 Met Ala Asp Ile Gln Met Thr Gln Ser 1 5 <210> 32 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 32 His Ala Arg Gly Val Phe Arg Arg Asp Ile Gln Met Thr Gln Ser 1 5 10 15 <210> 33 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 33 Met Asp Arg Gly Val Phe Arg Arg Asp Ile Gln Met Thr Gln Ser 1 5 10 15 <210> 34 <211> 504 <212> DNA <213> Methanococcus jannaschii <400> 34 gctctggcct acgacgagcc catctacctg agcgacggca acatcatcaa catcggcgag 60 ttcgtggaca agttcttcaa gaagtacaag aacagcatca agaaagagga caacggcttc 120 ggctggatcg acatcggcaa cgagaacatc tacatcaaga gcttcaacaa gctgtccctg 180 atcatcgagg acaagcggat cctgagagtg tggcggaaga agtacagcgg caagctgatc 240 aagatcacca ccaagaaccg gcgggagatc accctgaccc acgaccaccc cgtgtacatc 300 agcaagaccg gcgaggtgct ggaaatcaac gccgagatgg tgaaagtggg cgactacatc 360 tatatcccca agaacaacac catcaacctg gacgaggtga tcaaggtgga gaccgtggac 420 tacaacggcc acatctacga cctgaccgtg gaggacaacc acacctacat cgccggcaag 480 aacgagggct tcgccgtgag caac 504 <210> 35 <211> 168 <212> PRT <213> Methanococcus jannaschii <400> 35 Ala Leu Ala Tyr Asp Glu Pro Ile Tyr Leu Ser Asp Gly Asn Ile Ile 1 5 10 15 Asn Ile Gly Glu Phe Val Asp Lys Phe Phe Lys Lys Tyr Lys Asn Ser 20 25 30 Ile Lys Lys Glu Asp Asn Gly Phe Gly Trp Ile Asp Ile Gly Asn Glu 35 40 45 Asn Ile Tyr Ile Lys Ser Phe Asn Lys Leu Ser Leu Ile Ile Glu Asp 50 55 60 Lys Arg Ile Leu Arg Val Trp Arg Lys Lys Tyr Ser Gly Lys Leu Ile 65 70 75 80 Lys Ile Thr Thr Lys Asn Arg Arg Glu Ile Thr Leu Thr His Asp His 85 90 95 Pro Val Tyr Ile Ser Lys Thr Gly Glu Val Leu Glu Ile Asn Ala Glu 100 105 110 Met Val Lys Val Gly Asp Tyr Ile Tyr Ile Pro Lys Asn Asn Thr Ile 115 120 125 Asn Leu Asp Glu Val Ile Lys Val Glu Thr Val Asp Tyr Asn Gly His 130 135 140 Ile Tyr Asp Leu Thr Val Glu Asp Asn His Thr Tyr Ile Ala Gly Lys 145 150 155 160 Asn Glu Gly Phe Ala Val Ser Asn 165 <210> 36 <211> 588 <212> DNA <213> Pyrococcus abyssi <400> 36 gctctgtact acttcagcga gatccagctg cccaacggca aagagttcat cggcaaactg 60 gtggacgagc tgttcgagaa gtaccacgac aagatcggca agtacaagga catggaatac 120 gtggagctga acgaagagga caccttcgag gtgatcagca tcggccccga cctgagcgcc 180 aggcggcaca aggtgaccca cgtgtggcgg cggaaggtga aagacggcga gaagctggtg 240 aagatccgga ccgccagcgg caaagaactg gtgctgaccc aggaccaccc cgtgttcgtg 300 ctgctgggcc gggacgtggc cagacgggac gccggcaacg tgaaagtggg cgacgagatc 360 gccgtgctga acaccaggcc cgacttcagc gtgctgtccc cccctgccat gcccgagctg 420 ctgtccgagc ccttcaacta cgagctgtcc agcatcggcg acgtggcctg ggacgaggtg 480 gtggaggtgg acgagatcga cgccaagggc ctgggcgtgg agtacctgta cgacctgacc 540 gtggacatca accacaacta cgtggccaac ggcatcgtgg tgtccaac 588 <210> 37 <400> 37 000 <210> 38 <211> 1566 <212> DNA <213> Pyrococcus furiosus <400> 38 gcactttacg atttctctgt catccaacta tctaatggta gatttgtact tataggagat 60 ttagtcgagg aattattcaa gaagtatgcc gagaaaatta aaacatacaa agaccttgag 120 tacatagagc ttaacgagga agaccgtttt gaagttgtta gtgttagtcc agatttgaag 180 gctaataaac atgttgtctc aagagtttgg agaagaaagg tcagagaggg ggaaaagcta 240 atacgcataa agacgagaac tggcaacgaa ataatcctca ctagaaatca tccgctattt 300 gccttctcca atggagacgt agtcagaaaa gaggccgaga agctcaaagt tggggataga 360 gttgcagtga tgatgagacc tccttcacct cctcaaacta aagctgtagt tgaccctgca 420 atttacgtga aaataagtga ttactacctt gttccgaacg gaaaaggtat gataaaagtt 480 cctaacgatg gtattcctcc agaaaaggcc caatatcttc tttcagtaaa ttcatatcct 540 gtaaaattag tcagagaagt tgatgagaag ttatcctatc tcgctggagt tatactcggt 600 gatgggtata tatcatcgaa tggatactac atctcagcta catttgacga cgaagcttac 660 atggatgcct ttgtctctgt agtctcggac tttatcccta actatgtccc cagtataagg 720 aagaacggag attacacaat tgtaactgtt ggctcgaaga tttttgctga aatgctctca 780 aggatatttg gaataccaag gggcagaaaa tctatgtggg atattccaga cgtagtactt 840 tcaaatgacg atcttatgag atacttcata gctggacttt tcgacgctga tgggtacgta 900 gatgaaaatg ggccctccat agtcctagta acaaagagtg aaaccgtggc aaggaagatt 960 tggtacgttc ttcagaggtt ggggatcata agtacagttt cccgtgtaaa gagcagaggg 1020 tttaaagaag gcgagctgtt cagggtaatt attagtggtg ttgaagatct tgctaaattt 1080 gcaaaattca tacccctacg tcactcaaga aagagggcca aacttatgga gatattaagg 1140 actaagaagc catatcgggg aagaagaact taccgcgtgc cgatatccag tgatatgata 1200 gctcctctcc gtcaaatgtt gggattaact gttgcagagc tgtctaagtt agcgtcttat 1260 tatgcagggg aaaaagtttc tgaaagccta attaggcata tagaaaaggg aagggtcaaa 1320 gagataagac gctctacgct caaggggatt gcccttgctc tccagcagat agctaaagat 1380 gtgggtaacg aagaagcttg ggtgagagcc aagaggcttc aattgatagc tgagggagat 1440 gtttactggg atgaagtcgt aagtgttgag gaagttgatc cgaaggagct tggcattgag 1500 tacgtctatg acctcacggt tgaggacgac cacaattatg tggcaaatgg catactagtc 1560 tcaaac 1566 <210> 39 <211> 522 <212> PRT <213> Pyrococcus furiosus <400> 39 Ala Leu Tyr Asp Phe Ser Val Ile Gln Leu Ser Asn Gly Arg Phe Val 1 5 10 15 Leu Ile Gly Asp Leu Val Glu Glu Leu Phe Lys Lys Tyr Ala Glu Lys 20 25 30 Ile Lys Thr Tyr Lys Asp Leu Glu Tyr Ile Glu Leu Asn Glu Glu Asp 35 40 45 Arg Phe Glu Val Val Ser Val Ser Pro Asp Leu Lys Ala Asn Lys His 50 55 60 Val Val Ser Arg Val Trp Arg Arg Lys Val Arg Glu Gly Glu Lys Leu 65 70 75 80 Ile Arg Ile Lys Thr Arg Thr Gly Asn Glu Ile Ile Leu Thr Arg Asn 85 90 95 His Pro Leu Phe Ala Phe Ser Asn Gly Asp Val Val Arg Lys Glu Ala 100 105 110 Glu Lys Leu Lys Val Gly Asp Arg Val Ala Val Met Met Arg Pro Pro 115 120 125 Ser Pro Pro Gln Thr Lys Ala Val Val Asp Pro Ala Ile Tyr Val Lys 130 135 140 Ile Ser Asp Tyr Tyr Leu Val Pro Asn Gly Lys Gly Met Ile Lys Val 145 150 155 160 Pro Asn Asp Gly Ile Pro Pro Glu Lys Ala Gln Tyr Leu Leu Ser Val 165 170 175 Asn Ser Tyr Pro Val Lys Leu Val Arg Glu Val Asp Glu Lys Leu Ser 180 185 190 Tyr Leu Ala Gly Val Ile Leu Gly Asp Gly Tyr Ile Ser Ser Asn Gly 195 200 205 Tyr Tyr Ile Ser Ala Thr Phe Asp Asp Glu Ala Tyr Met Asp Ala Phe 210 215 220 Val Ser Val Val Ser Asp Phe Ile Pro Asn Tyr Val Pro Ser Ile Arg 225 230 235 240 Lys Asn Gly Asp Tyr Thr Ile Val Thr Val Gly Ser Lys Ile Phe Ala 245 250 255 Glu Met Leu Ser Arg Ile Phe Gly Ile Pro Arg Gly Arg Lys Ser Met 260 265 270 Trp Asp Ile Pro Asp Val Val Leu Ser Asn Asp Asp Leu Met Arg Tyr 275 280 285 Phe Ile Ala Gly Leu Phe Asp Ala Asp Gly Tyr Val Asp Glu Asn Gly 290 295 300 Pro Ser Ile Val Leu Val Thr Lys Ser Glu Thr Val Ala Arg Lys Ile 305 310 315 320 Trp Tyr Val Leu Gln Arg Leu Gly Ile Ile Ser Thr Val Ser Arg Val 325 330 335 Lys Ser Arg Gly Phe Lys Glu Gly Glu Leu Phe Arg Val Ile Ile Ser 340 345 350 Gly Val Glu Asp Leu Ala Lys Phe Ala Lys Phe Ile Pro Leu Arg His 355 360 365 Ser Arg Lys Arg Ala Lys Leu Met Glu Ile Leu Arg Thr Lys Lys Pro 370 375 380 Tyr Arg Gly Arg Arg Thr Tyr Arg Val Pro Ile Ser Ser Asp Met Ile 385 390 395 400 Ala Pro Leu Arg Gln Met Leu Gly Leu Thr Val Ala Glu Leu Ser Lys 405 410 415 Leu Ala Ser Tyr Tyr Ala Gly Glu Lys Val Ser Glu Ser Leu Ile Arg 420 425 430 His Ile Glu Lys Gly Arg Val Lys Glu Ile Arg Arg Ser Thr Leu Lys 435 440 445 Gly Ile Ala Leu Ala Leu Gln Gln Ile Ala Lys Asp Val Gly Asn Glu 450 455 460 Glu Ala Trp Val Arg Ala Lys Arg Leu Gln Leu Ile Ala Glu Gly Asp 465 470 475 480 Val Tyr Trp Asp Glu Val Val Ser Val Glu Glu Val Asp Pro Lys Glu 485 490 495 Leu Gly Ile Glu Tyr Val Tyr Asp Leu Thr Val Glu Asp Asp His Asn 500 505 510 Tyr Val Ala Asn Gly Ile Leu Val Ser Asn 515 520 <210> 40 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 40 Gly His Asp Gly 1 <210> 41 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 41 Ser Pro Gly Lys 1 <210> 42 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 42 Ala Leu Tyr Tyr 1 <210> 43 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 43 Cys Leu Tyr Tyr 1 <210> 44 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 44 Cys Met Gly Thr 1 <210> 45 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 45 Met Asp Ile Gln 1 <210> 46 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 46 Leu Ser Leu Ser Pro Gly Lys 1 5 <210> 47 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 47 Leu Ser Leu Ser Pro Gly 1 5 <210> 48 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 48 Ala Leu Tyr Tyr Phe Ser Glu Ile Gln 1 5 <210> 49 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 49 gcctctccct gtctccgggt gctctgtact acttcagcga gatc 44 <210> 50 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 50 gcctctccct gtctccgggt tgtctgtact acttcagcga gatc 44 <210> 51 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 51 tctccctgtc tccgggtaaa tgtctgtact acttcagcga gatc 44 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 52 cggcgtggag gtgcataatg 20 <210> 53 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 53 acccggagac agggagag 18 <210> 54 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 54 gggtcagcac cagttctttg 20 <210> 55 <211> 476 <212> PRT <213> Pyrococcus horikoshii <400> 55 Gln Cys Phe Ser Gly Glu Glu Val Ile Ile Val Glu Lys Gly Lys Asp 1 5 10 15 Arg Lys Val Val Lys Leu Arg Glu Phe Val Glu Asp Ala Leu Lys Glu 20 25 30 Pro Ser Gly Glu Gly Met Asp Gly Asp Ile Lys Val Thr Tyr Lys Asp 35 40 45 Leu Arg Gly Glu Asp Val Arg Ile Leu Thr Lys Asp Gly Phe Val Lys 50 55 60 Leu Leu Tyr Val Asn Lys Arg Glu Gly Lys Gln Lys Leu Arg Lys Ile 65 70 75 80 Val Asn Leu Asp Lys Asp Tyr Trp Leu Ala Val Thr Pro Asp His Lys 85 90 95 Val Phe Thr Ser Glu Gly Leu Lys Glu Ala Gly Glu Ile Thr Glu Lys 100 105 110 Asp Glu Ile Ile Arg Val Pro Leu Val Ile Leu Asp Gly Pro Lys Ile 115 120 125 Ala Ser Thr Tyr Gly Glu Asp Gly Lys Phe Asp Asp Tyr Ile Arg Trp 130 135 140 Lys Lys Tyr Tyr Glu Lys Thr Gly Asn Gly Tyr Lys Arg Ala Ala Lys 145 150 155 160 Glu Leu Asn Ile Lys Glu Ser Thr Leu Arg Trp Trp Thr Gln Gly Ala 165 170 175 Lys Pro Asn Ser Leu Lys Met Ile Glu Glu Leu Glu Lys Leu Asn Leu 180 185 190 Leu Pro Leu Thr Ser Glu Asp Ser Arg Leu Glu Lys Val Ala Ile Ile 195 200 205 Leu Gly Ala Leu Phe Ser Asp Gly Asn Ile Asp Arg Asn Phe Asn Thr 210 215 220 Leu Ser Phe Ile Ser Ser Glu Arg Lys Ala Ile Glu Arg Phe Val Glu 225 230 235 240 Thr Leu Lys Glu Leu Phe Gly Glu Phe Asn Tyr Glu Ile Arg Asp Asn 245 250 255 His Glu Ser Leu Gly Lys Ser Ile Leu Phe Arg Thr Trp Asp Arg Arg 260 265 270 Ile Ile Arg Phe Phe Val Ala Leu Gly Ala Pro Val Gly Asn Lys Thr 275 280 285 Lys Val Lys Leu Glu Leu Pro Trp Trp Ile Lys Leu Lys Pro Ser Leu 290 295 300 Phe Leu Ala Phe Met Asp Gly Leu Tyr Ser Gly Asp Gly Ser Val Pro 305 310 315 320 Arg Phe Ala Arg Tyr Glu Glu Gly Ile Lys Phe Asn Gly Thr Phe Glu 325 330 335 Ile Ala Gln Leu Thr Asp Asp Val Glu Lys Lys Leu Pro Phe Phe Glu 340 345 350 Glu Ile Ala Trp Tyr Leu Ser Phe Phe Gly Ile Lys Ala Lys Val Arg 355 360 365 Val Asp Lys Thr Gly Asp Lys Tyr Lys Val Arg Leu Ile Phe Ser Gln 370 375 380 Ser Ile Asp Asn Val Leu Asn Phe Leu Glu Phe Ile Pro Ile Ser Leu 385 390 395 400 Ser Pro Ala Lys Arg Glu Lys Phe Leu Arg Glu Val Glu Ser Tyr Leu 405 410 415 Ala Ala Val Pro Glu Ser Ser Leu Ala Gly Arg Ile Glu Glu Leu Arg 420 425 430 Glu His Phe Asn Arg Ile Lys Lys Gly Glu Arg Arg Ser Phe Ile Glu 435 440 445 Thr Trp Glu Val Val Asn Val Thr Tyr Asn Val Thr Thr Glu Thr Gly 450 455 460 Asn Leu Leu Ala Asn Gly Leu Phe Val Lys Asn Ser 465 470 475 <210> 56 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 56 His His His His His His 1 5 <210> 57 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 57 His His His His His His His His His His 1 5 10 <210> 58 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 58 His Gln His Gln His Gln 1 5 <210> 59 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 59 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Arg Gly Ala Arg Cys 20 <210> 60 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 60 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Arg Gly Ala Arg Cys 20 <210> 61 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 61 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Gln Leu Trp 1 5 10 15 Leu Ser Gly Ala Arg Cys 20 <210> 62 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 62 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Ser Gly Ala Arg Cys 20 <210> 63 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 63 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Asp Thr Arg Cys 20 <210> 64 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 64 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ala Arg Cys 20 <210> 65 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 65 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ala Arg Cys 20 <210> 66 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 66 Met Asp Met Arg Val Leu Ala Gln Leu Leu Gly Leu Leu Leu Leu Cys 1 5 10 15 Phe Pro Gly Ala Arg Cys 20 <210> 67 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 67 Met Asp Met Arg Val Leu Ala Gln Leu Leu Gly Leu Leu Leu Leu Cys 1 5 10 15 Phe Pro Gly Ala Arg Cys 20 <210> 68 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 68 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys 20 <210> 69 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 69 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys 20 <210> 70 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 70 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Arg Cys 20 <210> 71 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 71 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Arg Cys 20 <210> 72 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 72 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys 20 <210> 73 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 73 Met Asp Met Arg Val Pro Ala Gln Arg Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ala Arg Cys 20 <210> 74 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 74 Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Gly Ala Arg Cys 20 <210> 75 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 75 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys 20 <210> 76 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 76 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys 20 <210> 77 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 77 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Lys Cys 20 <210> 78 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 78 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Glu 20 <210> 79 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 79 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Glu 20 <210> 80 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 80 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Gly 20 <210> 81 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 81 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Gly 20 <210> 82 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 82 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Ile Pro 1 5 10 15 Gly Ser Ser Ala 20 <210> 83 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 83 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Ile Pro 1 5 10 15 Gly Ser Ser Ala 20 <210> 84 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 84 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Ser 1 5 10 15 Gly Ser Ser Gly 20 <210> 85 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 85 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Ser 1 5 10 15 Gly Ser Ser Gly 20 <210> 86 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 86 Met Arg Leu Leu Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Gly 20 <210> 87 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 87 Met Glu Thr Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly 20 <210> 88 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 88 Met Glu Thr Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly 20 <210> 89 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 89 Met Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly 20 <210> 90 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 90 Met Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly 20 <210> 91 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 91 Met Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly 20 <210> 92 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 92 Met Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Thr 1 5 10 15 Asp Thr Thr Gly 20 <210> 93 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 93 Met Glu Pro Trp Lys Pro Gln His Ser Phe Phe Phe Leu Leu Leu Leu 1 5 10 15 Trp Leu Pro Asp Thr Thr Gly 20 <210> 94 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 94 Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser 1 5 10 15 Gly Ala Tyr Gly 20 <210> 95 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 95 Met Gly Ser Gln Val His Leu Leu Ser Phe Leu Leu Leu Trp Ile Ser 1 5 10 15 Asp Thr Arg Ala 20 <210> 96 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 96 Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala 1 5 10 15 Ser Arg Gly <210> 97 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 97 Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala 1 5 10 15 Ser Arg Gly <210> 98 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 98 Met Val Ser Pro Leu Gln Phe Leu Arg Leu Leu Leu Leu Trp Val Pro 1 5 10 15 Ala Ser Arg Gly 20 <210> 99 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 99 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly 20 <210> 100 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 100 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly Gly 20 <210> 101 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 101 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly Gly Gly 20 <210> 102 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 102 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly Gly Gly Gly 20 25 <210> 103 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 103 Met Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Arg Cys 20 <210> 104 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 104 Met Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly 20 <210> 105 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 105 Met Arg Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu 1 5 10 15 Trp Phe Pro Gly Ser Arg Cys 20 <210> 106 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 106 Met Arg Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu 1 5 10 15 Trp Phe Pro Gly Ser Gly Gly 20 <210> 107 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 107 Met Arg Arg Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu 1 5 10 15 Leu Trp Phe Pro Gly Ser Gly Gly 20 <210> 108 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 108 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro 1 5 10 15 Gly Ser Gly Gly 20                          SEQUENCE LISTING <110> ABBOTT LABORATORIES <120> SORF CONSTRUCTS AND MULTIPLE GENE EXPRESSION <130> 54-08 WO <150> US 61 / 256,544 <151> 2009-10-30 <160> 108 <170> Kopatentin 1.71 <210> 1 <211> 335 <212> PRT Pyrococcus abyssi <400> 1 Gln Cys Phe Ser Gly Glu Glu Thr Val Val Ile Arg Glu Asn Gly Glu 1 5 10 15 Val Lys Val Leu Arg Leu Lys Asp Phe Val Glu Lys Ala Leu Glu Lys             20 25 30 Pro Ser Gly Glu Gly Leu Asp Gly Asp Val Lys Val Val Tyr His Asp         35 40 45 Phe Arg Asn Glu Asn Val Glu Val Leu Thr Lys Asp Gly Phe Thr Lys     50 55 60 Leu Leu Tyr Ala Asn Lys Arg Ile Gly Lys Gln Lys Leu Arg Arg Val 65 70 75 80 Val Asn Leu Glu Lys Asp Tyr Trp Phe Ala Leu Thr Pro Asp His Lys                 85 90 95 Val Tyr Thr Thr Asp Gly Leu Lys Glu Ala Gly Glu Ile Thr Glu Lys             100 105 110 Asp Glu Leu Ile Ser Val Pro Ile Thr Val Phe Asp Cys Glu Asp Glu         115 120 125 Asp Leu Lys Lys Ile Gly Leu Leu Pro Leu Thr Ser Asp Asp Glu Arg     130 135 140 Leu Arg Lys Ile Ala Thr Leu Met Gly Ile Leu Phe Asn Gly Gly Ser 145 150 155 160 Ile Asp Glu Gly Leu Gly Val Leu Thr Leu Lys Ser Glu Arg Ser Val                 165 170 175 Ile Glu Lys Phe Val Ile Thr Leu Lys Glu Leu Phe Gly Lys Phe Glu             180 185 190 Tyr Glu Ile Ile Lys Glu Glu Asn Thr Ile Leu Lys Thr Arg Asp Pro         195 200 205 Arg Ile Ile Lys Phe Leu Val Gly Leu Gly Ala Pro Ile Glu Gly Lys     210 215 220 Asp Leu Lys Met Pro Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu 225 230 235 240 Ala Phe Leu Glu Gly Phe Arg Ala His Ile Val Glu Gln Leu Val Asp                 245 250 255 Asp Pro Asn Lys Asn Leu Pro Phe Phe Gln Glu Leu Ser Trp Tyr Leu             260 265 270 Gly Leu Phe Gly Ile Lys Ala Asp Ile Lys Val Glu Glu Val Gly Asp         275 280 285 Lys His Lys Ile Ile Phe Asp Ala Gly Arg Leu Asp Val Asp Lys Gln     290 295 300 Phe Ile Glu Thr Trp Glu Asp Val Glu Val Thr Tyr Asn Leu Thr Thr 305 310 315 320 Glu Lys Gly Asn Leu Leu Ala Asn Gly Leu Phe Val Lys Asn Ser                 325 330 335 <210> 2 <211> 999 <212> DNA Pyrococcus abyssi <400> 2 tgcttcagcg gcgaggaaac cgtggtgatc cgggagaacg gcgaggtgaa ggtgctgcgg 60 ctgaaggact tcgtggagaa ggccctggaa aagccctccg gcgagggcct ggacggcgac 120 gtgaaagtgg tgtaccacga cttccggaac gagaacgtgg aggtgctgac caaggacggc 180 ttcaccaagc tgctgtacgc caacaagcgg atcggcaagc agaaactgcg gcgggtggtg 240 aacctggaaa aggactactg gttcgccctg acccccgacc acaaggtgta caccaccgac 300 ggcctgaaag aggccggcga gatcaccgag aaggacgagc tgatcagcgt gcccatcacc 360 gtgttcgact gcgaggacga ggacctgaag aagatcggcc tgctgcccct gaccagcgac 420 gacgagcggc tgcggaagat cgccaccctg atgggcatcc tgttcaacgg cggcagcatc 480 gatgagggcc tgggcgtgct gaccctgaag agcgagcgga gcgtgatcga gaagttcgtg 540 atcaccctga aagagctgtt cggcaagttc gagtacgaga tcatcaaaga ggaaaacacc 600 atcctgaaaa cccgggaccc ccggatcatc aagtttctgg tgggcctggg agcccccatc 660 gagggcaagg atctgaagat gccttggtgg gtgaagctga agcccagcct gttcctggcc 720 ttcctggaag gcttccgggc ccacatcgtg gagcagctgg tcgacgaccc caacaagaat 780 ctgcccttct ttcaggaact gagctggtat ctgggcctgt tcggcatcaa ggccgacatc 840 aaggtggagg aagtgggcga caagcacaag atcatcttcg acgccggcag gctggacgtg 900 gacaagcagt tcatcgagac ctgggaggat gtggaggtga cctacaacct gaccacagag 960 aagggcaatc tgctggccaa cggcctgttc gtgaagaac 999 <210> 3 <211> 333 <212> PRT Pyrococcus abyssi <400> 3 Cys Phe Ser Gly Glu Glu Thr Val Val Ile Arg Glu Asn Gly Glu Val 1 5 10 15 Lys Val Leu Arg Leu Lys Asp Phe Val Glu Lys Ala Leu Glu Lys Pro             20 25 30 Ser Gly Glu Gly Leu Asp Gly Asp Val Lys Val Val Tyr His Asp Phe         35 40 45 Arg Asn Glu Asn Val Glu Val Leu Thr Lys Asp Gly Phe Thr Lys Leu     50 55 60 Leu Tyr Ala Asn Lys Arg Ile Gly Lys Gln Lys Leu Arg Arg Val Val 65 70 75 80 Asn Leu Glu Lys Asp Tyr Trp Phe Ala Leu Thr Pro Asp His Lys Val                 85 90 95 Tyr Thr Thr Asp Gly Leu Lys Glu Ala Gly Glu Ile Thr Glu Lys Asp             100 105 110 Glu Leu Ile Ser Val Pro Ile Thr Val Phe Asp Cys Glu Asp Glu Asp         115 120 125 Leu Lys Lys Ile Gly Leu Leu Pro Leu Thr Ser Asp Asp Glu Arg Leu     130 135 140 Arg Lys Ile Ala Thr Leu Met Gly Ile Leu Phe Asn Gly Ser Ile 145 150 155 160 Asp Glu Gly Leu Gly Val Leu Thr Leu Lys Ser Glu Arg Ser Val Ile                 165 170 175 Glu Lys Phe Val Ile Thr Leu Lys Glu Leu Phe Gly Lys Phe Glu Tyr             180 185 190 Glu Ile Ile Lys Glu Glu Asn Thr Ile Leu Lys Thr Arg Asp Pro Arg         195 200 205 Ile Ile Lys Phe Leu Val Gly Leu Gly Ala Pro Ile Glu Gly Lys Asp     210 215 220 Leu Lys Met Pro Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu Ala 225 230 235 240 Phe Leu Glu Gly Phe Arg Ala His Ile Val Glu Gln Leu Val Asp Asp                 245 250 255 Pro Asn Lys Asn Leu Pro Phe Phe Gln Glu Leu Ser Trp Tyr Leu Gly             260 265 270 Leu Phe Gly Ile Lys Ala Asp Ile Lys Val Glu Glu Val Gly Asp Lys         275 280 285 His Lys Ile Ile Phe Asp Ala Gly Arg Leu Asp Val Asp Lys Gln Phe     290 295 300 Ile Glu Thr Trp Glu Asp Val Glu Val Thr Tyr Asn Leu Thr Thr Glu 305 310 315 320 Lys Gly Asn Leu Leu Ala Asn Gly Leu Phe Val Lys Asn                 325 330 <210> 4 <211> 403 <212> PRT <213> Pyrococcus furiosus <400> 4 Gln Cys Phe Ser Gly Glu Glu Val Ile Leu Ile Glu Lys Asp Gly Glu 1 5 10 15 Lys Lys Val Phe Lys Leu Arg Glu Phe Val Asp Gly Leu Leu Lys Glu             20 25 30 Ala Ser Gly Glu Gly Met Asp Gly Ser Ile Arg Val Val Tyr Lys Asp         35 40 45 Leu Gln Gly Glu Asn Ile Lys Ile Leu Thr Lys Asp Gly Leu Val Lys     50 55 60 Leu Leu Tyr Val Asn Arg Arg Glu Gly Lys Gln Lys Leu Arg Lys Ile 65 70 75 80 Val Asn Leu Glu Lys Asp Tyr Trp Leu Ala Leu Thr Pro Glu His Lys                 85 90 95 Val Tyr Thr Ile Lys Gly Leu Lys Glu Ala Gly Glu Ile Thr Lys Asp             100 105 110 Asp Glu Ile Ile Arg Val Pro Leu Thr Ile Leu Asp Gly Phe Asp Val         115 120 125 Ala Glu Lys Ser Ile Arg Glu Glu Leu Glu Arg Leu Ser Leu Leu Pro     130 135 140 Leu Asn Ser Glu Asp Ser Arg Leu Glu Lys Ile Ala Gly Ile Met Gly 145 150 155 160 Ala Leu Phe Gly Ser Gly Gly Ile Asp Glu Asn Leu Asn Thr Leu Ser                 165 170 175 Phe Val Ser Ser Glu Lys Lys Thr Ile Glu Gln Phe Val Lys Ala Leu             180 185 190 Ser Glu Leu Phe Gly Glu Phe Asp Tyr Lys Ile Glu Glu Lys Glu Asn         195 200 205 Ser Ile Ile Phe Arg Thr Cys Asp Lys Arg Ile Val Thr Phe Phe Ala     210 215 220 Thr Leu Gly Ala Pro Val Gly Asp Lys Ser Lys Val Lys Leu Lys Leu 225 230 235 240 Pro Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu Ala Phe Met Asp                 245 250 255 Gly Leu Tyr Ser Ser Asn Arg Asn Asp Lys Glu Ile Leu Glu Ile Thr             260 265 270 Gln Leu Thr Asp Asn Val Glu Thr Phe Phe Glu Glu Ile Ser Trp Tyr         275 280 285 Leu Ser Phe Phe Gly Ile Lys Ala Glu Ala Glu Glu Asp Glu Glu Lys     290 295 300 Asp Lys Tyr Arg Ala Arg Leu Thr Leu Ser Ser Ser Ile Asp Asn Met 305 310 315 320 Leu Asn Phe Ile Glu Phe Ile Pro Ile Ser Phe Ser Pro Ala Lys Arg                 325 330 335 Glu Lys Phe Phe Lys Glu Ile Glu Lys Tyr Leu Glu Tyr Ser Ile Pro             340 345 350 Glu Lys Thr Glu Asp Leu Lys Lys Arg Val Lys Arg Val Lys Lys Gly         355 360 365 Glu Arg Arg Asn Phe Leu Glu Ser Trp Glu Glu Val Glu Val Thr Tyr     370 375 380 Asn Val Thr Thr Glu Thr Gly Asn Leu Leu Ala Asn Gly Leu Phe Val 385 390 395 400 Lys asn ser              <210> 5 <211> 1203 <212> DNA <213> Pyrococcus furiosus <400> 5 tgttttagcg gtgaagaagt tatcttaatt gaaaaggacg gagagaaaaa agtcttcaaa 60 cttagggagt tcgttgacgg tctccttaag gaggcgtctg gagaagggat ggacggaagt 120 attagagtag tttataaaga tcttcaaggg gaaaacataa aaatactcac aaaagacgga 180 cttgtaaagc tcctttatgt caatagaaga gaagggaagc aaaagcttag aaaaatagta 240 aatcttgaaa aggattattg gcttgcatta acacctgaac ataaagtgta cacaataaag 300 ggccttaaag aagctggaga gataactaaa gatgatgaga taataagagt gcctctcaca 360 attcttgacg gctttgacgt agccgagaag agtataagag aggaacttga aaggcttagc 420 ctacttccac taaatagtga agacagtaga ctagaaaaga tagcaggaat catgggcgca 480 ctctttggta gtggaggtat cgatgagaat ctcaataccc ttagctttgt ttctagcgag 540 aagaaaacaa ttgaacagtt tgttaaagca ctcagcgagc tcttcgggga atttgactat 600 aaaattgaag aaaaagaaaa cagcattatt ttcagaacat gtgataaaag aatagtgacc 660 ttctttgcta cacttggtgc accagttgga gacaaaagca aagttaagct taagcttcca 720 tggtgggtca agcttaagcc gtcacttttc ctcgccttca tggatggtct ctacagtagc 780 aataggaatg acaaagaaat cctcgaaata actcaactta ctgacaacgt cgaaacgttc 840 ttcgaggaaa tatcttggta tctgagcttc tttggaatta aggcagaagc tgaagaggat 900 gaagaaaaag ataaatacag ggctagactt acgctatcct catcaataga caacatgctt 960 aatttcattg agttcattcc aataagcttt tctccagcaa agagagaaaa attctttaag 1020 gaaattgaaa aatatctgga atatagcatt cccgaaaaga ctgaggatct taagaaacga 1080 gttaagagag ttaagaaggg agagagaagg aatttcctcg aaagctggga ggaagttgaa 1140 gttacttaca acgtaactac agagacagga aatctacttg ctaacggtct atttgttaag 1200 aac 1203 <210> 6 <211> 401 <212> PRT <213> Pyrococcus furiosus <400> 6 Cys Phe Ser Gly Glu Glu Val Ile Leu Ile Glu Lys Asp Gly Glu Lys 1 5 10 15 Lys Val Phe Lys Leu Arg Glu Phe Val Asp Gly Leu Leu Lys Glu Ala             20 25 30 Ser Gly Glu Gly Met Asp Gly Ser Ile Arg Val Val Tyr Lys Asp Leu         35 40 45 Gln Gly Glu Asn Ile Lys Ile Leu Thr Lys Asp Gly Leu Val Lys Leu     50 55 60 Leu Tyr Val Asn Arg Arg Glu Gly Lys Gln Lys Leu Arg Lys Ile Val 65 70 75 80 Asn Leu Glu Lys Asp Tyr Trp Leu Ala Leu Thr Pro Glu His Lys Val                 85 90 95 Tyr Thr Ile Lys Gly Leu Lys Glu Ala Gly Glu Ile Thr Lys Asp Asp             100 105 110 Glu Ile Ile Arg Val Pro Leu Thr Ile Leu Asp Gly Phe Asp Val Ala         115 120 125 Glu Lys Ser Ile Arg Glu Glu Leu Glu Arg Leu Ser Leu Leu Pro Leu     130 135 140 Asn Ser Glu Asp Ser Arg Leu Glu Lys Ile Ala Gly Ile Met Gly Ala 145 150 155 160 Leu Phe Gly Ser Gly Gly Ile Asp Glu Asn Leu Asn Thr Leu Ser Phe                 165 170 175 Val Ser Ser Glu Lys Lys Thr Ile Glu Gln Phe Val Lys Ala Leu Ser             180 185 190 Glu Leu Phe Gly Glu Phe Asp Tyr Lys Ile Glu Glu Lys Glu Asn Ser         195 200 205 Ile Ile Phe Arg Thr Cys Asp Lys Arg Ile Val Thr Phe Phe Ala Thr     210 215 220 Leu Gly Ala Pro Val Gly Asp Lys Ser Lys Val Lys Leu Lys Leu Pro 225 230 235 240 Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu Ala Phe Met Asp Gly                 245 250 255 Leu Tyr Ser Ser Asn Arg Asn Asp Lys Glu Ile Leu Glu Ile Thr Gln             260 265 270 Leu Thr Asp Asn Val Glu Thr Phe Phe Glu Glu Ile Ser Trp Tyr Leu         275 280 285 Ser Phe Phe Gly Ile Lys Ala Glu Ala Glu Glu Asp Glu Glu Lys Asp     290 295 300 Lys Tyr Arg Ala Arg Leu Thr Leu Ser Ser Ser Ile Asp Asn Met Leu 305 310 315 320 Asn Phe Ile Glu Phe Ile Pro Ile Ser Phe Ser Pro Ala Lys Arg Glu                 325 330 335 Lys Phe Phe Lys Glu Ile Glu Lys Tyr Leu Glu Tyr Ser Ile Pro Glu             340 345 350 Lys Thr Glu Asp Leu Lys Lys Arg Val Lys Arg Val Lys Lys Gly Glu         355 360 365 Arg Arg Asn Phe Leu Glu Ser Trp Glu Glu Val Glu Val Thr Tyr Asn     370 375 380 Val Thr Thr Glu Thr Gly Asn Leu Leu Ala Asn Gly Leu Phe Val Lys 385 390 395 400 Asn      <210> 7 <211> 333 <212> PRT Pyrococcus abyssi <400> 7 Cys Phe Ser Gly Glu Glu Thr Val Val Ile Arg Glu Asn Gly Glu Val 1 5 10 15 Lys Val Leu Arg Leu Lys Asp Phe Val Glu Lys Ala Leu Glu Lys Pro             20 25 30 Ser Gly Glu Gly Leu Asp Gly Asp Val Lys Val Val Tyr His Asp Phe         35 40 45 Arg Asn Glu Asn Val Glu Val Leu Thr Lys Asp Gly Phe Thr Lys Leu     50 55 60 Leu Tyr Ala Asn Lys Arg Ile Gly Lys Gln Lys Leu Arg Arg Val Val 65 70 75 80 Asn Leu Glu Lys Asp Tyr Trp Phe Ala Leu Thr Pro Asp His Lys Val                 85 90 95 Tyr Thr Thr Asp Gly Leu Lys Glu Ala Gly Glu Ile Thr Glu Lys Asp             100 105 110 Glu Leu Ile Ser Val Pro Ile Thr Val Phe Asp Cys Glu Asp Glu Asp         115 120 125 Leu Lys Lys Ile Gly Leu Leu Pro Leu Thr Ser Asp Asp Glu Arg Leu     130 135 140 Arg Lys Ile Ala Thr Leu Met Gly Ile Leu Phe Asn Gly Ser Ile 145 150 155 160 Asp Glu Gly Leu Gly Val Leu Thr Leu Lys Ser Glu Arg Ser Val Ile                 165 170 175 Glu Lys Phe Val Ile Thr Leu Lys Glu Leu Phe Gly Lys Phe Glu Tyr             180 185 190 Glu Ile Ile Lys Glu Glu Asn Thr Ile Leu Lys Thr Arg Asp Pro Arg         195 200 205 Ile Ile Lys Phe Leu Val Gly Leu Gly Ala Pro Ile Glu Gly Lys Asp     210 215 220 Leu Lys Met Pro Trp Trp Val Lys Leu Lys Pro Ser Leu Phe Leu Ala 225 230 235 240 Phe Leu Glu Gly Phe Arg Ala His Ile Val Glu Gln Leu Val Asp Asp                 245 250 255 Pro Asn Lys Asn Leu Pro Phe Phe Gln Glu Leu Ser Trp Tyr Leu Gly             260 265 270 Leu Phe Gly Ile Lys Ala Asp Ile Lys Val Glu Glu Val Gly Asp Lys         275 280 285 His Lys Ile Ile Phe Asp Ala Gly Arg Leu Asp Val Asp Lys Gln Phe     290 295 300 Ile Glu Thr Trp Glu Asp Val Glu Val Thr Tyr Asn Leu Thr Thr Glu 305 310 315 320 Lys Gly Asn Leu Leu Ala Asn Gly Leu Phe Val Lys Asn                 325 330 <210> 8 <211> 999 <212> DNA Pyrococcus abyssi <400> 8 tgcttcagcg gcgaggaaac cgtggtgatc cgggagaacg gcgaggtgaa ggtgctgcgg 60 ctgaaggact tcgtggagaa ggccctggaa aagccctccg gcgagggcct ggacggcgac 120 gtgaaagtgg tgtaccacga cttccggaac gagaacgtgg aggtgctgac caaggacggc 180 ttcaccaagc tgctgtacgc caacaagcgg atcggcaagc agaaactgcg gcgggtggtg 240 aacctggaaa aggactactg gttcgccctg acccccgacc acaaggtgta caccaccgac 300 ggcctgaaag aggccggcga gatcaccgag aaggacgagc tgatcagcgt gcccatcacc 360 gtgttcgact gcgaggacga ggacctgaag aagatcggcc tgctgcccct gaccagcgac 420 gacgagcggc tgcggaagat cgccaccctg atgggcatcc tgttcaacgg cggcagcatc 480 gatgagggcc tgggcgtgct gaccctgaag agcgagcgga gcgtgatcga gaagttcgtg 540 atcaccctga aagagctgtt cggcaagttc gagtacgaga tcatcaaaga ggaaaacacc 600 atcctgaaaa cccgggaccc ccggatcatc aagtttctgg tgggcctggg agcccccatc 660 gagggcaagg atctgaagat gccttggtgg gtgaagctga agcccagcct gttcctggcc 720 ttcctggaag gcttccgggc ccacatcgtg gagcagctgg tcgacgaccc caacaagaat 780 ctgcccttct ttcaggaact gagctggtat ctgggcctgt tcggcatcaa ggccgacatc 840 aaggtggagg aagtgggcga caagcacaag atcatcttcg acgccggcag gctggacgtg 900 gacaagcagt tcatcgagac ctgggaggat gtggaggtga cctacaacct gaccacagag 960 aagggcaatc tgctggccaa cggcctgttc gtgaagaac 999 <210> 9 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 9 Glu Val Gln Leu Val Glu Ser Gly Gly Gly 1 5 10 <210> 10 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 10 Met Glu Val Gln Leu Val Glu Ser Gly Gly 1 5 10 <210> 11 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 11 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser 1 5 10 <210> 12 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 12 Met Asp Ile Gln Met Thr Gln Ser Pro Ser 1 5 10 <210> 13 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 13 Ala Asn Gly Leu Phe Val Lys Asn 1 5 <210> 14 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 14 Met Arg Ala Lys Arg 1 5 <210> 15 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 15 His Ala Arg Gly Val Phe Arg Arg 1 5 <210> 16 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 16 Met Asp Arg Gly Val Phe Arg Arg 1 5 <210> 17 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 17 Asp Ile Gln Met Thr Gln Ser 1 5 <210> 18 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 18 Ala Ile Gln Met Thr Gln Ser 1 5 <210> 19 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 19 Asn Ile Gln Met Thr Gln Ser 1 5 <210> 20 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 20 Asn Phe Gln Met Thr Gln Ser 1 5 <210> 21 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 21 Met Asp Ile Gln Met Thr Gln Ser 1 5 <210> 22 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 22 Met Arg Ala Lys Arg Asp Ile Gln Met Thr Gln Ser 1 5 10 <210> 23 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 23 Tyr Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 24 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 24 Arg Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 25 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 25 Val Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 26 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 26 Gln Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 27 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 27 Ala Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 28 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 28 His Ala Asp Ile Gln Met Thr Gln Ser 1 5 <210> 29 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 29 Tyr Ala Asp Ile Gln Met Thr Gln Ser 1 5 <210> 30 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 30 Met Pro Asp Ile Gln Met Thr Gln Ser 1 5 <210> 31 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 31 Met Ala Asp Ile Gln Met Thr Gln Ser 1 5 <210> 32 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 32 His Ala Arg Gly Val Phe Arg Arg Asp Ile Gln Met Thr Gln Ser 1 5 10 15 <210> 33 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 33 Met Asp Arg Gly Val Phe Arg Arg Asp Ile Gln Met Thr Gln Ser 1 5 10 15 <210> 34 <211> 504 <212> DNA <213> Methanococcus jannaschii <400> 34 gctctggcct acgacgagcc catctacctg agcgacggca acatcatcaa catcggcgag 60 ttcgtggaca agttcttcaa gaagtacaag aacagcatca agaaagagga caacggcttc 120 ggctggatcg acatcggcaa cgagaacatc tacatcaaga gcttcaacaa gctgtccctg 180 atcatcgagg acaagcggat cctgagagtg tggcggaaga agtacagcgg caagctgatc 240 aagatcacca ccaagaaccg gcgggagatc accctgaccc acgaccaccc cgtgtacatc 300 agcaagaccg gcgaggtgct ggaaatcaac gccgagatgg tgaaagtggg cgactacatc 360 tatatcccca agaacaacac catcaacctg gacgaggtga tcaaggtgga gaccgtggac 420 tacaacggcc acatctacga cctgaccgtg gaggacaacc acacctacat cgccggcaag 480 aacgagggct tcgccgtgag caac 504 <210> 35 <211> 168 <212> PRT <213> Methanococcus jannaschii <400> 35 Ala Leu Ala Tyr Asp Glu Pro Ile Tyr Leu Ser Asp Gly Asn Ile Ile 1 5 10 15 Asn Ile Gly Glu Phe Val Asp Lys Phe Phe Lys Lys Tyr Lys Asn Ser             20 25 30 Ile Lys Lys Glu Asp Asn Gly Phe Gly Trp Ile Asp Ile Gly Asn Glu         35 40 45 Asn Ile Tyr Ile Lys Ser Phe Asn Lys Leu Ser Leu Ile Ile Glu Asp     50 55 60 Lys Arg Ile Leu Arg Val Trp Arg Lys Lys Tyr Ser Gly Lys Leu Ile 65 70 75 80 Lys Ile Thr Thr Lys Asn Arg Arg Glu Ile Thr Leu Thr His Asp His                 85 90 95 Pro Val Tyr Ile Ser Lys Thr Gly Glu Val Leu Glu Ile Asn Ala Glu             100 105 110 Met Val Lys Val Gly Asp Tyr Ile Tyr Ile Pro Lys Asn Asn Thr Ile         115 120 125 Asn Leu Asp Glu Val Ile Lys Val Glu Thr Val Asp Tyr Asn Gly His     130 135 140 Ile Tyr Asp Leu Thr Val Glu Asp Asn His Thr Tyr Ile Ala Gly Lys 145 150 155 160 Asn Glu Gly Phe Ala Val Ser Asn                 165 <210> 36 <211> 588 <212> DNA Pyrococcus abyssi <400> 36 gctctgtact acttcagcga gatccagctg cccaacggca aagagttcat cggcaaactg 60 gtggacgagc tgttcgagaa gtaccacgac aagatcggca agtacaagga catggaatac 120 gtggagctga acgaagagga caccttcgag gtgatcagca tcggccccga cctgagcgcc 180 aggcggcaca aggtgaccca cgtgtggcgg cggaaggtga aagacggcga gaagctggtg 240 aagatccgga ccgccagcgg caaagaactg gtgctgaccc aggaccaccc cgtgttcgtg 300 ctgctgggcc gggacgtggc cagacgggac gccggcaacg tgaaagtggg cgacgagatc 360 gccgtgctga acaccaggcc cgacttcagc gtgctgtccc cccctgccat gcccgagctg 420 ctgtccgagc ccttcaacta cgagctgtcc agcatcggcg acgtggcctg ggacgaggtg 480 gtggaggtgg acgagatcga cgccaagggc ctgggcgtgg agtacctgta cgacctgacc 540 gtggacatca accacaacta cgtggccaac ggcatcgtgg tgtccaac 588 <210> 37 <400> 37 000 <210> 38 <211> 1566 <212> DNA <213> Pyrococcus furiosus <400> 38 gcactttacg atttctctgt catccaacta tctaatggta gatttgtact tataggagat 60 ttagtcgagg aattattcaa gaagtatgcc gagaaaatta aaacatacaa agaccttgag 120 tacatagagc ttaacgagga agaccgtttt gaagttgtta gtgttagtcc agatttgaag 180 gctaataaac atgttgtctc aagagtttgg agaagaaagg tcagagaggg ggaaaagcta 240 atacgcataa agacgagaac tggcaacgaa ataatcctca ctagaaatca tccgctattt 300 gccttctcca atggagacgt agtcagaaaa gaggccgaga agctcaaagt tggggataga 360 gttgcagtga tgatgagacc tccttcacct cctcaaacta aagctgtagt tgaccctgca 420 atttacgtga aaataagtga ttactacctt gttccgaacg gaaaaggtat gataaaagtt 480 cctaacgatg gtattcctcc agaaaaggcc caatatcttc tttcagtaaa ttcatatcct 540 gtaaaattag tcagagaagt tgatgagaag ttatcctatc tcgctggagt tatactcggt 600 gatgggtata tatcatcgaa tggatactac atctcagcta catttgacga cgaagcttac 660 atggatgcct ttgtctctgt agtctcggac tttatcccta actatgtccc cagtataagg 720 aagaacggag attacacaat tgtaactgtt ggctcgaaga tttttgctga aatgctctca 780 aggatatttg gaataccaag gggcagaaaa tctatgtggg atattccaga cgtagtactt 840 tcaaatgacg atcttatgag atacttcata gctggacttt tcgacgctga tgggtacgta 900 gatgaaaatg ggccctccat agtcctagta acaaagagtg aaaccgtggc aaggaagatt 960 tggtacgttc ttcagaggtt ggggatcata agtacagttt cccgtgtaaa gagcagaggg 1020 tttaaagaag gcgagctgtt cagggtaatt attagtggtg ttgaagatct tgctaaattt 1080 gcaaaattca tacccctacg tcactcaaga aagagggcca aacttatgga gatattaagg 1140 actaagaagc catatcgggg aagaagaact taccgcgtgc cgatatccag tgatatgata 1200 gctcctctcc gtcaaatgtt gggattaact gttgcagagc tgtctaagtt agcgtcttat 1260 tatgcagggg aaaaagtttc tgaaagccta attaggcata tagaaaaggg aagggtcaaa 1320 gagataagac gctctacgct caaggggatt gcccttgctc tccagcagat agctaaagat 1380 gtgggtaacg aagaagcttg ggtgagagcc aagaggcttc aattgatagc tgagggagat 1440 gtttactggg atgaagtcgt aagtgttgag gaagttgatc cgaaggagct tggcattgag 1500 tacgtctatg acctcacggt tgaggacgac cacaattatg tggcaaatgg catactagtc 1560 tcaaac 1566 <210> 39 <211> 522 <212> PRT <213> Pyrococcus furiosus <400> 39 Ala Leu Tyr Asp Phe Ser Val Ile Gln Leu Ser Asn Gly Arg Phe Val 1 5 10 15 Leu Ile Gly Asp Leu Val Glu Glu Leu Phe Lys Lys Tyr Ala Glu Lys             20 25 30 Ile Lys Thr Tyr Lys Asp Leu Glu Tyr Ile Glu Leu Asn Glu Glu Asp         35 40 45 Arg Phe Glu Val Val Ser Val Ser Pro Asp Leu Lys Ala Asn Lys His     50 55 60 Val Val Ser Arg Val Trp Arg Arg Lys Val Arg Glu Gly Glu Lys Leu 65 70 75 80 Ile Arg Ile Lys Thr Arg Thr Gly Asn Glu Ile Ile Leu Thr Arg Asn                 85 90 95 His Pro Leu Phe Ala Phe Ser Asn Gly Asp Val Val Arg Lys Glu Ala             100 105 110 Glu Lys Leu Lys Val Gly Asp Arg Val Ala Val Met Met Arg Pro Pro         115 120 125 Ser Pro Pro Gln Thr Lys Ala Val Val Asp Pro Ala Ile Tyr Val Lys     130 135 140 Ile Ser Asp Tyr Tyr Leu Val Pro Asn Gly Lys Gly Met Ile Lys Val 145 150 155 160 Pro Asn Asp Gly Ile Pro Pro Glu Lys Ala Gln Tyr Leu Leu Ser Val                 165 170 175 Asn Ser Tyr Pro Val Lys Leu Val Arg Glu Val Asp Glu Lys Leu Ser             180 185 190 Tyr Leu Ala Gly Val Ile Leu Gly Asp Gly Tyr Ile Ser Ser Asn Gly         195 200 205 Tyr Tyr Ile Ser Ala Thr Phe Asp Asp Glu Ala Tyr Met Asp Ala Phe     210 215 220 Val Ser Val Val Ser Asp Phe Ile Pro Asn Tyr Val Pro Ser Ile Arg 225 230 235 240 Lys Asn Gly Asp Tyr Thr Ile Val Thr Val Gly Ser Lys Ile Phe Ala                 245 250 255 Glu Met Leu Ser Arg Ile Phe Gly Ile Pro Arg Gly Arg Lys Ser Met             260 265 270 Trp Asp Ile Pro Asp Val Val Leu Ser Asn Asp Asp Leu Met Arg Tyr         275 280 285 Phe Ile Ala Gly Leu Phe Asp Ala Asp Gly Tyr Val Asp Glu Asn Gly     290 295 300 Pro Ser Ile Val Leu Val Thr Lys Ser Glu Thr Val Ala Arg Lys Ile 305 310 315 320 Trp Tyr Val Leu Gln Arg Leu Gly Ile Ile Ser Thr Val Ser Arg Val                 325 330 335 Lys Ser Arg Gly Phe Lys Glu Gly Glu Leu Phe Arg Val Ile Ile Ser             340 345 350 Gly Val Glu Asp Leu Ala Lys Phe Ala Lys Phe Ile Pro Leu Arg His         355 360 365 Ser Arg Lys Arg Ala Lys Leu Met Glu Ile Leu Arg Thr Lys Lys Pro     370 375 380 Tyr Arg Gly Arg Arg Thr Tyr Arg Val Pro Ile Ser Ser Asp Met Ile 385 390 395 400 Ala Pro Leu Arg Gln Met Leu Gly Leu Thr Val Ala Glu Leu Ser Lys                 405 410 415 Leu Ala Ser Tyr Tyr Ala Gly Glu Lys Val Ser Glu Ser Leu Ile Arg             420 425 430 His Ile Glu Lys Gly Arg Val Lys Glu Ile Arg Arg Ser Thr Leu Lys         435 440 445 Gly Ile Ala Leu Ala Leu Gln Gln Ile Ala Lys Asp Val Gly Asn Glu     450 455 460 Glu Ala Trp Val Arg Ala Lys Arg Leu Gln Leu Ile Ala Glu Gly Asp 465 470 475 480 Val Tyr Trp Asp Glu Val Val Ser Val Glu Glu Val Asp Pro Lys Glu                 485 490 495 Leu Gly Ile Glu Tyr Val Tyr Asp Leu Thr Val Glu Asp Asp His Asn             500 505 510 Tyr Val Ala Asn Gly Ile Leu Val Ser Asn         515 520 <210> 40 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 40 Gly His Asp Gly One <210> 41 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 41 Ser Pro Gly Lys One <210> 42 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 42 Ala Leu Tyr Tyr One <210> 43 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 43 Cys Leu Tyr Tyr One <210> 44 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 44 Cys Met Gly Thr One <210> 45 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 45 Met Asp Ile Gln One <210> 46 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 46 Leu Ser Leu Ser Pro Gly Lys 1 5 <210> 47 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 47 Leu Ser Leu Ser Pro Gly 1 5 <210> 48 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 48 Ala Leu Tyr Tyr Phe Ser Glu Ile Gln 1 5 <210> 49 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 49 gcctctccct gtctccgggt gctctgtact acttcagcga gatc 44 <210> 50 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 50 gcctctccct gtctccgggt tgtctgtact acttcagcga gatc 44 <210> 51 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 51 tctccctgtc tccgggtaaa tgtctgtact acttcagcga gatc 44 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 52 cggcgtggag gtgcataatg 20 <210> 53 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 53 acccggagac agggagag 18 <210> 54 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 54 gggtcagcac cagttctttg 20 <210> 55 <211> 476 <212> PRT <213> Pyrococcus horikoshii <400> 55 Gln Cys Phe Ser Gly Glu Glu Val Ile Ile Val Glu Lys Gly Lys Asp 1 5 10 15 Arg Lys Val Val Lys Leu Arg Glu Phe Val Glu Asp Ala Leu Lys Glu             20 25 30 Pro Ser Gly Glu Gly Met Asp Gly Asp Ile Lys Val Thr Tyr Lys Asp         35 40 45 Leu Arg Gly Glu Asp Val Arg Ile Leu Thr Lys Asp Gly Phe Val Lys     50 55 60 Leu Leu Tyr Val Asn Lys Arg Glu Gly Lys Gln Lys Leu Arg Lys Ile 65 70 75 80 Val Asn Leu Asp Lys Asp Tyr Trp Leu Ala Val Thr Pro Asp His Lys                 85 90 95 Val Phe Thr Ser Glu Gly Leu Lys Glu Ala Gly Glu Ile Thr Glu Lys             100 105 110 Asp Glu Ile Ile Arg Val Pro Leu Val Ile Leu Asp Gly Pro Lys Ile         115 120 125 Ala Ser Thr Tyr Gly Glu Asp Gly Lys Phe Asp Asp Tyr Ile Arg Trp     130 135 140 Lys Lys Tyr Tyr Glu Lys Thr Gly Asn Gly Tyr Lys Arg Ala Ala Lys 145 150 155 160 Glu Leu Asn Ile Lys Glu Ser Thr Leu Arg Trp Trp Thr Gln Gly Ala                 165 170 175 Lys Pro Asn Ser Leu Lys Met Ile Glu Glu Leu Glu Lys Leu Asn Leu             180 185 190 Leu Pro Leu Thr Ser Glu Asp Ser Arg Leu Glu Lys Val Ala Ile Ile         195 200 205 Leu Gly Ala Leu Phe Ser Asp Gly Asn Ile Asp Arg Asn Phe Asn Thr     210 215 220 Leu Ser Phe Ile Ser Ser Glu Arg Lys Ala Ile Glu Arg Phe Val Glu 225 230 235 240 Thr Leu Lys Glu Leu Phe Gly Glu Phe Asn Tyr Glu Ile Arg Asp Asn                 245 250 255 His Glu Ser Leu Gly Lys Ser Ile Leu Phe Arg Thr Trp Asp Arg Arg             260 265 270 Ile Ile Arg Phe Phe Val Ala Leu Gly Ala Pro Val Gly Asn Lys Thr         275 280 285 Lys Val Lys Leu Glu Leu Pro Trp Trp Ile Lys Leu Lys Pro Ser Leu     290 295 300 Phe Leu Ala Phe Met Asp Gly Leu Tyr Ser Gly Asp Gly Ser Val Pro 305 310 315 320 Arg Phe Ala Arg Tyr Glu Glu Gly Ile Lys Phe Asn Gly Thr Phe Glu                 325 330 335 Ile Ala Gln Leu Thr Asp Asp Val Glu Lys Lys Leu Pro Phe Phe Glu             340 345 350 Glu Ile Ala Trp Tyr Leu Ser Phe Phe Gly Ile Lys Ala Lys Val Arg         355 360 365 Val Asp Lys Thr Gly Asp Lys Tyr Lys Val Arg Leu Ile Phe Ser Gln     370 375 380 Ser Ile Asp Asn Val Leu Asn Phe Leu Glu Phe Ile Pro Ile Ser Leu 385 390 395 400 Ser Pro Ala Lys Arg Glu Lys Phe Leu Arg Glu Val Glu Ser Tyr Leu                 405 410 415 Ala Ala Val Pro Glu Ser Ser Leu Ala Gly Arg Ile Glu Glu Leu Arg             420 425 430 Glu His Phe Asn Arg Ile Lys Lys Gly Glu Arg Arg Ser Phe Ile Glu         435 440 445 Thr Trp Glu Val Val Asn Val Thr Tyr Asn Val Thr Thr Glu Thr Gly     450 455 460 Asn Leu Leu Ala Asn Gly Leu Phe Val Lys Asn Ser 465 470 475 <210> 56 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 56 His His His His His 1 5 <210> 57 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 57 His His His His His His His His His His 1 5 10 <210> 58 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 58 His Gln His Gln His Gln 1 5 <210> 59 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 59 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Arg Gly Ala Arg Cys             20 <210> 60 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 60 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Arg Gly Ala Arg Cys             20 <210> 61 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 61 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Gln Leu Trp 1 5 10 15 Leu Ser Gly Ala Arg Cys             20 <210> 62 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 62 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Ser Gly Ala Arg Cys             20 <210> 63 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 63 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Asp Thr Arg Cys             20 <210> 64 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 64 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ala Arg Cys             20 <210> 65 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 65 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ala Arg Cys             20 <210> 66 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 66 Met Asp Met Arg Val Leu Ala Gln Leu Leu Gly Leu Leu Leu Leu Cys 1 5 10 15 Phe Pro Gly Ala Arg Cys             20 <210> 67 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 67 Met Asp Met Arg Val Leu Ala Gln Leu Leu Gly Leu Leu Leu Leu Cys 1 5 10 15 Phe Pro Gly Ala Arg Cys             20 <210> 68 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 68 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys             20 <210> 69 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 69 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys             20 <210> 70 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 70 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Arg Cys             20 <210> 71 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 71 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Arg Cys             20 <210> 72 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 72 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys             20 <210> 73 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 73 Met Asp Met Arg Val Pro Ala Gln Arg Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ala Arg Cys             20 <210> 74 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 74 Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Gly ala arg cys             20 <210> 75 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 75 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys             20 <210> 76 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 76 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Arg Cys             20 <210> 77 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 77 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Leu Pro Gly Ala Lys Cys             20 <210> 78 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 78 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Glu             20 <210> 79 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 79 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Glu             20 <210> 80 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 80 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Gly             20 <210> 81 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 81 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Gly             20 <210> 82 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 82 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Ile Pro 1 5 10 15 Gly Ser Ser Ala             20 <210> 83 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 83 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Ile Pro 1 5 10 15 Gly Ser Ser Ala             20 <210> 84 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 84 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Ser 1 5 10 15 Gly Ser Ser Gly             20 <210> 85 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 85 Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Ser 1 5 10 15 Gly Ser Ser Gly             20 <210> 86 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 86 Met Arg Leu Leu Ala Gln Leu Leu Gly Leu Leu Met Leu Trp Val Pro 1 5 10 15 Gly Ser Ser Gly             20 <210> 87 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 87 Met Glu Thr Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly             20 <210> 88 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 88 Met Glu Thr Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly             20 <210> 89 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 89 Met Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly             20 <210> 90 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 90 Met Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly             20 <210> 91 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 91 Met Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro 1 5 10 15 Asp Thr Thr Gly             20 <210> 92 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 92 Met Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Thr 1 5 10 15 Asp Thr Thr Gly             20 <210> 93 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 93 Met Glu Pro Trp Lys Pro Gln His Ser Phe Phe Phe Leu Leu Leu Leu 1 5 10 15 Trp Leu Pro Asp Thr Thr Gly             20 <210> 94 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 94 Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser 1 5 10 15 Gly Ala Tyr Gly             20 <210> 95 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 95 Met Gly Ser Gln Val His Leu Leu Ser Phe Leu Leu Leu Trp Ile Ser 1 5 10 15 Asp Thr Arg Ala             20 <210> 96 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 96 Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala 1 5 10 15 Ser Arg Gly              <210> 97 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 97 Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala 1 5 10 15 Ser Arg Gly              <210> 98 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 98 Met Val Ser Pro Leu Gln Phe Leu Arg Leu Leu Leu Leu Trp Val Pro 1 5 10 15 Ala Ser Arg Gly             20 <210> 99 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 99 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly             20 <210> 100 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 100 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly Gly             20 <210> 101 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 101 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly Gly             20 <210> 102 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 102 Met Asp Met Arg Val Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly Gly Gly             20 25 <210> 103 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 103 Met Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Arg Cys             20 <210> 104 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 104 Met Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp 1 5 10 15 Phe Pro Gly Ser Gly Gly             20 <210> 105 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 105 Met Arg Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu 1 5 10 15 Trp Phe Pro Gly Ser Arg Cys             20 <210> 106 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 106 Met Arg Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu 1 5 10 15 Trp Phe Pro Gly Ser Gly Gly             20 <210> 107 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 107 Met Arg Arg Arg Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu 1 5 10 15 Leu Trp Phe Pro Gly Ser Gly Gly             20 <210> 108 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic construct <400> 108 Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro 1 5 10 15 Gly Ser Gly Gly             20

Claims (46)

단일 전사 해독 프레임 삽입체(single open reading frame insert)를 포함하는 하나 이상의 재조합체 단백질 생성물을 생성하기 위한 분리되거나 정제된 발현 벡터로서, 상기 삽입체는
(a) 시그날 펩타이드를 암호화하는 시그날 펩타이드 핵산 서열;
(b) 제1의 폴리펩타이드를 암호화하는 제1의 핵산 서열;
(c) 제1의 단백질 절단 부위를 암호화하는 제1의 개재(intervening) 핵산 서열(여기서 제1의 단백질 절단 부위는 파이로코쿠스(Pyrococcus)의 lon 프로테아제 유전자 또는 파이로코쿠스 또는 메타노코쿠스(Methanococcus)의 klbA 유전자의 인테인 분절, 또는 이들로부터 기원한 변형된 인테인 분절에 의해 제공된다); 및
(d) 제2의 폴리펩타이드를 암호화하는 제2의 핵산 서열을 포함하고, 여기서 상기 제1의 단백질 절단 부위를 암호화하는 상기 제1의 개재 핵산 서열은 상기 제1의 핵산 서열과 상기 제2의 핵산 서열 사이에 작동적으로 위치하고; 여기서 상기 시그날 펩타이드를 암호화하는 상기 시그날 펩타이드 핵산 서열은 제1의 핵산 서열 앞에 작동적으로 위치하며; 여기서 상기 발현 벡터는 상기 제1의 단백질 절단 부위에서 절단가능한 단일 전사 해독 프레임 폴리펩타이드를 발현할 수 있는,
단일 전사 해독 프레임 삽입체를 포함하는 하나 이상의 재조합체 단백질 생성물을 생성하기 위한 분리되거나 정제된 발현 벡터.
An isolated or purified expression vector for producing one or more recombinant protein products comprising a single open reading frame insert, wherein the insert is
(a) a signal peptide nucleic acid sequence encoding a signal peptide;
(b) a first nucleic acid sequence encoding a first polypeptide;
(c) a first intervening nucleic acid sequence encoding a first protein cleavage site, wherein the first protein cleavage site is a lon protease gene of Pyrococcus or Pyrococcus or Methanococcus By an intein segment of the klbA gene, or a modified intein segment derived therefrom); And
(d) a second nucleic acid sequence encoding a second polypeptide, wherein said first intervening nucleic acid sequence encoding said first protein cleavage site comprises said first nucleic acid sequence and said second nucleic acid sequence; Operatively located between the nucleic acid sequences; Wherein the signal peptide nucleic acid sequence encoding the signal peptide is operatively located before the first nucleic acid sequence; Wherein said expression vector is capable of expressing a single transcription translation frame polypeptide cleavable at said first protein cleavage site,
An isolated or purified expression vector for producing one or more recombinant protein products comprising a single transcription translation frame insert.
제1항에 있어서, 상기 제1의 단백질 절단 부위가 파이로코쿠스 아비씨(Pyrococcus abyssi), 파이로코쿠스 푸리오수스(Pyrococcus furiosus) 또는 파이로코쿠스 호리코시이(Pyrococcus horikoshii) OT3의 lon 프로테아제 유전자의 인테인 분절; 또는 파이로코쿠스 아비씨, 파이로코쿠스 푸리오수스 또는 메타노코쿠스 잔나스키이(Methanococcus jannaschii)의 klbA 유전자의 인테인 분절; 또는 이들로부터 각각 기원한 변형된 인테인 분절에 의해 제공되는, 발현 벡터.The method of claim 1, wherein the first protein cleavage site is Pyrococcus abyssi ), Pyrococcus furiosus ) or Pyrococcus horikoshii ) intein segment of the lon protease gene of OT3; Or intein segments of the klbA gene of Pyrococcus acci, Pyrococcus puriosus or Methanococcus jannaschii ; Or an expression vector provided by a modified intein segment, each derived from them. 제1항에 있어서, 상기 인테인 분절 또는 변형된 인테인 분절이, 리신, 세린이지만 히스티딘이 아닌 끝에서 두번째 잔기(penultimate residue)를 암호화하는, 발현 벡터.The expression vector of claim 1, wherein the intein segment or modified intein segment encodes a penultimate residue at the end of lysine, serine but not histidine. 제1항에 있어서, 상기 인테인 분절 또는 변형된 인테인 분절이 상기 제1의 폴리펩타이드를 절단할 수는 있지만 이를 상기 제2의 폴리펩타이드에 완전히 연결하는 것은 아닌, 발현 벡터.The expression vector of claim 1, wherein said intein segment or modified intein segment is capable of cleaving said first polypeptide but not fully connecting it to said second polypeptide. 제1항에 있어서, 상기 제1의 단백질 절단 부위가 서열 번호 1, 3, 4, 6, 7, 55, 35, 37, 및 39로 이루어진 그룹에서 선택된 서열을 포함하는 인테인 분절 및 이들로부터 기원한 변형된 인테인 분절에 의해 제공되는, 발현 벡터.The intetan segment of claim 1, wherein the first protein cleavage site comprises a sequence selected from the group consisting of SEQ ID NOs: 1, 3, 4, 6, 7, 55, 35, 37, and 39 An expression vector provided by one modified intein segment. 제1항 내지 제5항 중의 어느 한 항에 있어서, 제1의 폴리펩타이드 및 제2의 폴리펩타이드가 다합체성 조립할 수 있는, 발현 벡터.The expression vector according to any one of claims 1 to 5, wherein the first polypeptide and the second polypeptide can multimericly assemble. 제1항 내지 제6항 중의 어느 한 항에 있어서, 제1의 폴리펩타이드 및 제2의 폴리펩타이드 중 적어도 하나가 세포외 분비할 수 있는, 발현 벡터.The expression vector of claim 1, wherein at least one of the first polypeptide and the second polypeptide is capable of extracellular secretion. 제1항 내지 제7항 중의 어느 한 항에 있어서, 상기 제1의 폴리펩타이드 및 제2의 폴리펩타이드 중 적어도 하나가 포유동물 기원인, 발현 벡터.8. The expression vector of claim 1, wherein at least one of the first polypeptide and the second polypeptide is of mammalian origin. 9. 제1항 내지 제8항 중의 어느 한 항에 있어서, 상기 제1의 폴리펩타이드가 면역글로불린 중쇄 또는 이의 기능성 단편을 포함하고, 상기 제2의 폴리펩타이드가 면역글로불린 경쇄 또는 이의 기능성 단편을 포함하며, 상기 제1의 폴리펩타이드는 상기 제2의 폴리펩타이드의 상부에 존재하는, 발현 벡터.The method of claim 1, wherein the first polypeptide comprises an immunoglobulin heavy chain or functional fragment thereof, and the second polypeptide comprises an immunoglobulin light chain or functional fragment thereof, Wherein said first polypeptide is on top of said second polypeptide. 제1항 내지 제9항 중의 어느 한 항에 있어서, 상기 시그날 펩타이드 핵산 서열 중 하나만을 포함하는, 발현 벡터.The expression vector of claim 1, which comprises only one of the signal peptide nucleic acid sequences. 제1항 내지 제10항 중의 어느 한 항에 있어서, 제3의 폴리펩타이드를 암호화하는 제3의 핵산 서열, 및 제2의 단백질 절단 부위를 암호화하는 제2의 개재 핵산 서열을 추가로 포함하며; 여기서, 제2의 개재 핵산 서열 및 제3의 핵산 서열은, 이러한 순서로 상기 제2의 핵산 서열 이후에 작동적으로 위치하는, 발현 벡터.The method of claim 1, further comprising: a third nucleic acid sequence encoding a third polypeptide, and a second intervening nucleic acid sequence encoding a second protein cleavage site; Wherein the second intervening nucleic acid sequence and the third nucleic acid sequence are operatively located after the second nucleic acid sequence in this order. 제1항 내지 제11항 중의 어느 한 항에 있어서, 상기 제1 및 제2의 폴리펩타이드가 TNF-α(종양 괴사 인자-알파), 에리트로포이에틴 수용체, RSV, EL/셀렉틴, 인터루킨-1, 인터루킨-12, 인터루킨-13, 인터루킨-18, 인터루킨-23, 인터루킨-33, CD81, CD19, IGF1, IGF2, EGFR, CXCL-13, GLP-1R, 프로스타글란딘 E2 및 아밀로이드 베타로 이루어진 그룹에서 선택된 항원에 결합하는 것에 대해 지시된 항원 특이성을 지닌, 기능적 항체 또는 다른 항원 인식 분자를 포함하는, 발현 벡터.The method of claim 1, wherein the first and second polypeptides comprise TNF-α (tumor necrosis factor-alpha), erythropoietin receptor, RSV, EL / selectin, interleukin-1, Antigen selected from the group consisting of interleukin-12, interleukin-13, interleukin-18, interleukin-23, interleukin-33, CD81, CD19, IGF1, IGF2, EGFR, CXCL-13, GLP-1R, prostaglandin E2 and amyloid beta An expression vector comprising a functional antibody or other antigen recognition molecule with antigen specificity directed against binding. 제1항 내지 제12항 중의 어느 한 항에 있어서, 제1 및 제2의 폴리펩타이드가 D2E7, EL246, ABT-007, ABT-325, 또는 ABT-874의 항체로부터의 면역글로불린 쇄의 쌍을 포함하는, 발현 벡터.The method of claim 1, wherein the first and second polypeptides comprise a pair of immunoglobulin chains from an antibody of D2E7, EL246, ABT-007, ABT-325, or ABT-874. Expression vector. 제1항 내지 제13항 중의 어느 한 항에 있어서, 제1 및 제2의 폴리펩타이드가 D2E7, EL246, ABT-007, ABT-325, ABT-874, 또는 다른 항체의 유사 분절로부터의 면역글로불린 중쇄 또는 면역글로불린 경쇄 분절로부터 각각 독립적으로 선택되는, 발현 벡터.The immunoglobulin heavy chain according to any one of claims 1 to 13, wherein the first and second polypeptides are from analogous segments of D2E7, EL246, ABT-007, ABT-325, ABT-874, or other antibodies. Or an expression globulin light chain segment, each independently selected. 제1항 내지 제14항 중의 어느 한 항에 있어서, 상기 벡터가 상기 삽입체에 대한 프로모터 조절 성분을 추가로 포함하는, 발현 벡터.The expression vector of claim 1, wherein the vector further comprises a promoter regulatory component for the insert. 제15항에 있어서, 상기 프로모터 조절 성분이 유도성 또는 구성적인, 발현 벡터.The expression vector of claim 15, wherein the promoter regulatory component is inducible or constitutive. 제15항에 있어서, 상기 프로모터 조절 성분이 조직 특이적인, 발현 벡터.The expression vector of claim 15, wherein the promoter regulatory component is tissue specific. 제15항에 있어서, 상기 프로모터가 아데노바이러스 주요 레이트 프로모터(adenovirus major late promoter)를 포함하는, 발현 벡터.The expression vector of claim 15, wherein the promoter comprises an adenovirus major late promoter. 제1항 내지 제18항 중의 어느 한 항에 따른 벡터를 포함하는 숙주 세포.A host cell comprising the vector according to any one of claims 1 to 18. 제19항에 있어서, 상기 숙주 세포가 원핵 세포인, 숙주 세포.The host cell of claim 19, wherein the host cell is a prokaryotic cell. 제20항에 있어서, 상기 숙주 세포가 에스케리키아 콜라이(Escherichia coli)인, 숙주 세포.The host cell of claim 20, wherein the host cell is Escherichia coli . 제19항에 있어서, 상기 숙주 세포가 진핵 세포인, 숙주 세포.The host cell of claim 19, wherein the host cell is a eukaryotic cell. 제22항에 있어서, 상기 진핵 세포가 원생생물 세포, 동물 세포, 식물 세포 및 진균 세포로 이루어진 그룹에서 선택되는, 숙주세포.The host cell of claim 22, wherein the eukaryotic cell is selected from the group consisting of protozoal cells, animal cells, plant cells and fungal cells. 제23항에 있어서, 상기 진핵 세포가 포유동물 세포, 조류 세포 및 곤충 세포로 이루어진 그룹에서 선택된 동물 세포인, 숙주 세포.The host cell of claim 23, wherein the eukaryotic cell is an animal cell selected from the group consisting of mammalian cells, avian cells, and insect cells. 제24항에 있어서, 상기 숙주 세포가 포유동물 세포주인, 숙주 세포.The host cell of claim 24, wherein the host cell is a mammalian cell line. 제24항에 있어서, 상기 숙주 세포가 CHO 세포 또는 디하이드로폴레이트 리덕타제-결핍성 CHO 세포인, 숙주 세포.The host cell of claim 24, wherein the host cell is a CHO cell or a dihydrofolate reductase-deficient CHO cell. 제24항에 있어서, 상기 숙주 세포가 COS 세포 또는 HEK 세포인, 숙주 세포.The host cell of claim 24, wherein the host cell is a COS cell or HEK cell. 제23항에 있어서, 상기 숙주 세포가 효모 세포인, 숙주 세포.The host cell of claim 23, wherein the host cell is a yeast cell. 제28항에 있어서, 효모 세포가 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)인, 숙주 세포.The host cell of claim 28, wherein the yeast cell is Saccharomyces cerevisiae . 제24항에 있어서, 상기 숙주 세포가 스포도프테라 프루기페르다(Spodoptera frugiperda) Sf9 곤충 세포인, 숙주 세포.The host cell of claim 24, wherein the host cell is Spodoptera frugiperda Sf9 insect cell. 제19항에 따른 숙주 세포를 벡터 단백질의 발현을 허용하기에 충분한 조건하에서 배양 배지 속에서 배양함을 포함하여, 재조합체 폴리프로테인(polyprotein) 또는 다수의 단백질을 생산하는 방법.20. A method for producing recombinant polyprotein or a plurality of proteins, comprising culturing the host cell according to claim 19 in a culture medium under conditions sufficient to permit expression of the vector protein. 제31항에 있어서, 상기 벡터 단백질을 회수하고/하거나 정제함을 추가로 포함하는 방법.32. The method of claim 31, further comprising recovering and / or purifying the vector protein. 제31항 내지 제32항 중 어느 한 항에 있어서, 상기 다수의 단백질이 다합체성 조립할 수 있는, 방법.33. The method of any one of claims 31-32, wherein the plurality of proteins can multimeric assemble. 제31항 내지 제33항 중의 어느 한 항에 있어서, 재조합체 폴리프로테인 또는 다수의 단백질이 생물학적으로 기능성이고/이거나 치료제인, 방법.34. The method of any one of claims 31-33, wherein the recombinant polyprotein or a plurality of proteins is biologically functional and / or therapeutic. 제19항에 따른 숙주 세포를 배양 배지 속에서 재조합체 생성물을 생산하기에 충분한 조건하에 배양함을 포함하여, 면역글로불린 단백질 또는 이의 기능성 단편, 조립된 항체, 또는 다른 항원 인식 분자인 재조합체 생성물을 생산하는 방법.A recombinant product, which is an immunoglobulin protein or functional fragment thereof, assembled antibody, or other antigen recognition molecule, comprising culturing a host cell according to claim 19 under conditions sufficient to produce a recombinant product in a culture medium. How to produce. 제31항 내지 제35항 중의 어느 한 항에 따른 방법에 따라 생산된 단백질.A protein produced according to the method according to any one of claims 31 to 35. 제31항 내지 제36항 중의 어느 한 항에 따른 방법에 따라 생산된 폴리프로테인.37. Polyprotein produced according to the method according to any one of claims 31 to 36. 제31항 내지 제37항 중의 어느 한 항에 따른 방법에 따라 생산된, 조립된 면역글로불린; 조립된 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편.38. An assembled immunoglobulin produced according to the method of any one of claims 31-37; Assembled other antigen recognition molecule; Or individual immunoglobulin chains or functional fragments thereof. 제38항에 있어서, 종양 괴사 인자-α, 에리트로포이에틴 수용체, RSV, EL/셀렉틴, 인터루킨-1 , 인터루킨-12, 인터루킨-13, 인터루킨-18, 인터루킨-23, 인터루킨-33, CD81 , CD19, IGF1, IGF2, EGFR, 프로스타글란딘 E2, CXCL-13, GLP-1R, 또는 아밀로이드 베타에 대한 특이적인 항원 결합에 영향을 미치거나 기여하는 능력이 존재하는, 면역글로불린; 다른 항원 인식 분자; 또는 개개의 면역글로불린 쇄 또는 이의 기능성 단편.The method of claim 38, wherein the tumor necrosis factor-α, erythropoietin receptor, RSV, EL / selectin, interleukin-1, interleukin-12, interleukin-13, interleukin-18, interleukin-23, interleukin-33, CD81, CD19 Immunoglobulins, which have the ability to affect or contribute to specific antigen binding to IGF1, IGF2, EGFR, prostaglandin E2, CXCL-13, GLP-1R, or amyloid beta; Other antigen recognition molecules; Or individual immunoglobulin chains or functional fragments thereof. 제39항에 있어서, 면역글로불린이 D2E7 또는 ABT-874이거나 기능성 단편이 각각 이의 단편인, 면역글로불린 또는 이의 기능성 단편.The immunoglobulin or functional fragment thereof of claim 39, wherein the immunoglobulin is D2E7 or ABT-874 or the functional fragment is a fragment thereof, respectively. 제36항 내지 제40항 중의 어느 한 항에 따른 치료학적 유효량의 단백질 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물.41. A pharmaceutical composition comprising a therapeutically effective amount of a protein according to any one of claims 36-40 and a pharmaceutically acceptable carrier. 제1항 내지 제18항 중 어느 한 항에 있어서, 태그(tag)를 암호화하는 핵산 서열을 추가로 포함하는 발현 벡터.The expression vector of claim 1, further comprising a nucleic acid sequence encoding a tag. 제1항 내지 제18항 중의 어느 한 항에 있어서, 상기 개재 핵산 서열이 태그를 추가로 암호화하는, 발현 벡터.The expression vector of claim 1, wherein the intervening nucleic acid sequence further encodes a tag. 발현 벡터, 당해 벡터를 갖는 숙주 세포, 벡터 발현 생성물, 약제학적 조성물 및/또는, 상기한 것들 중의 어느 하나의 제조 방법 또는 사용 방법으로서, 상기 벡터가 제1항 내지 제18항 중의 어느 한 항에 따른 벡터이고, 경쇄 시그날 펩타이드를 암호화하는 분절을 추가로 포함하는, 발현 벡터, 당해 벡터를 갖는 숙주 세포, 벡터 발현 생성물, 약제학적 조성물 및/또는, 상기한 것들 중의 어느 하나의 제조 방법 또는 사용 방법.An expression vector, a host cell having the vector, a vector expression product, a pharmaceutical composition, and / or a method of making or using any of the above, wherein the vector is a compound according to any one of claims 1 to 18. And a method according to any one of the foregoing, an expression vector, a host cell having the vector, a vector expression product, a pharmaceutical composition and / or any one of the foregoing. . 제44항에 있어서, 암호화된 경쇄 시그날 펩타이드가 A17, A18, A19, A26 및 H2G로 이루어진 그룹에서 선택된 카파 경쇄 시그날 펩타이드인, 벡터, 숙주 세포, 벡터 발현 생성물, 약제학적 조성물 및/또는, 제조 방법 또는 사용 방법.45. The vector, host cell, vector expression product, pharmaceutical composition and / or method of manufacture of claim 44, wherein the encoded light chain signal peptide is a kappa light chain signal peptide selected from the group consisting of A17, A18, A19, A26 and H2G. Or how to use. 제44항에 있어서, 암호화된 경쇄 시그날 펩타이드가 VKII 카파 경쇄 시그날 펩타이드 A18, 서열 번호 82(아미노산 서열 MRLPAQLLGLLMLWIPGSSA)인, 벡터, 숙주 세포, 벡터 발현 생성물, 약제학적 조성물 및/또는, 제조 방법 또는 사용 방법.45. The vector, host cell, vector expression product, pharmaceutical composition and / or method of manufacture or use of claim 44, wherein the encoded light chain signal peptide is VKII kappa light chain signal peptide A18, SEQ ID NO: 82 (amino acid sequence MRLPAQLLGLLMLWIPGSSA). .
KR1020127013812A 2009-10-30 2010-10-28 Sorf constructs and multiple gene expression KR20120091251A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US25654409P 2009-10-30 2009-10-30
US61/256,544 2009-10-30

Publications (1)

Publication Number Publication Date
KR20120091251A true KR20120091251A (en) 2012-08-17

Family

ID=43431207

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127013812A KR20120091251A (en) 2009-10-30 2010-10-28 Sorf constructs and multiple gene expression

Country Status (13)

Country Link
US (1) US20110150861A1 (en)
EP (1) EP2493923A1 (en)
JP (1) JP2013509188A (en)
KR (1) KR20120091251A (en)
CN (1) CN102812040A (en)
AU (1) AU2010313395A1 (en)
CA (1) CA2776990A1 (en)
IL (1) IL219022A0 (en)
IN (1) IN2012DN03281A (en)
MX (1) MX2012005117A (en)
RU (1) RU2012122240A (en)
TW (1) TW201124535A (en)
WO (1) WO2011053699A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11103932B2 (en) 2018-09-17 2021-08-31 Korea Institute Of Machinery & Materials Cutting head operated by centrifugal force and cutting apparatus including the same

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013078433A1 (en) * 2011-11-23 2013-05-30 University Of Hawaii Auto-processing domains for polypeptide expression
WO2014058389A1 (en) 2012-10-12 2014-04-17 Agency For Science, Technology And Research Optimised heavy chain and light chain signal peptides for the production of recombinant antibody therapeutics
AU2020345943A1 (en) 2019-09-10 2022-03-31 Obsidian Therapeutics, Inc. CA2-IL15 fusion proteins for tunable regulation
CN114107390B (en) * 2021-11-05 2023-10-24 中国科学院精密测量科学与技术创新研究院 rAAV vector for expressing antibody IgG1 and application thereof

Family Cites Families (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6455275B1 (en) * 1980-02-25 2002-09-24 The Trustees Of Columbia University In The City Of New York DNA construct for producing proteinaceous materials in eucaryotic cells
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US4937190A (en) * 1987-10-15 1990-06-26 Wisconsin Alumni Research Foundation Translation enhancer
ES2059482T3 (en) * 1987-12-23 1994-11-16 Boehringer Ingelheim Int EXPRESSION OF HRV2 PROTEASE P2A CODED BY VIRUSES.
US5648254A (en) * 1988-01-15 1997-07-15 Zymogenetics, Inc. Co-expression in eukaryotic cells
US5436146A (en) * 1989-09-07 1995-07-25 The Trustees Of Princeton University Helper-free stocks of recombinant adeno-associated virus vectors
US5162601A (en) * 1989-11-22 1992-11-10 The Upjohn Company Plant potyvirus expression vector with a gene for protease
US5519164A (en) * 1990-02-01 1996-05-21 Hoechst Aktiengesellschaft Expression of a multigene RNA having self-splicing activity
US5633282A (en) * 1990-05-25 1997-05-27 British Technology Group Limited Inhibition of viral infection
US5637481A (en) * 1993-02-01 1997-06-10 Bristol-Myers Squibb Company Expression vectors encoding bispecific fusion proteins and methods of producing biologically active bispecific fusion proteins in a mammalian cell
KR950701681A (en) * 1992-05-22 1995-04-28 로저 엔, 플레어 Antibodies Specific for Multiple Adhesion Molecules
DE4228457A1 (en) * 1992-08-27 1994-04-28 Beiersdorf Ag Production of heterodimeric PDGF-AB using a bicistronic vector system in mammalian cells
DE4228458A1 (en) * 1992-08-27 1994-06-01 Beiersdorf Ag Multicistronic expression units and their use
US5834247A (en) * 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
US5496714A (en) * 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
SG44845A1 (en) * 1993-01-12 1997-12-19 Biogen Inc Recombitant anti-vla4 antibody molecules
US5532142A (en) * 1993-02-12 1996-07-02 Board Of Regents, The University Of Texas System Method of isolation and purification of fusion polypeptides
US6133028A (en) * 1993-05-28 2000-10-17 Transgene S.A. Defective adenoviruses and corresponding complementation lines
US5834256A (en) 1993-06-11 1998-11-10 Cell Genesys, Inc. Method for production of high titer virus and high efficiency retroviral mediated transduction of mammalian cells
GB9326271D0 (en) * 1993-12-23 1994-02-23 Zeneca Ltd Expression of self-processing polyprotein in transgenic plants
US5643745A (en) 1994-02-03 1997-07-01 University Of Hawaii Heterologous dimeric proteins produced in heterokaryons
ATE336587T1 (en) * 1994-06-10 2006-09-15 Genvec Inc ADENOVIRUS VECTOR SYSTEMS AND CELL LINES
FR2722208B1 (en) * 1994-07-05 1996-10-04 Inst Nat Sante Rech Med NEW INTERNAL RIBOSOME ENTRY SITE, VECTOR CONTAINING SAME AND THERAPEUTIC USE
US5955072A (en) * 1994-07-13 1999-09-21 Sankyo Company, Limited Expression systems utilizing autolyzing fusion proteins and a reducing polypeptide
WO1996013583A2 (en) * 1994-10-20 1996-05-09 Morphosys Gesellschaft Für Proteinoptimierung Mbh Targeted hetero-association of recombinant proteins to multi-functional complexes
US20020168342A1 (en) * 1994-11-03 2002-11-14 Cell Genesys, Inc. Novel adenoviral vectors, packaging cell lines, recombinant adenoviruses and methods
US5872005A (en) 1994-11-03 1999-02-16 Cell Genesys Inc. Packaging cell lines for adeno-associated viral vectors
AT403167B (en) * 1994-11-14 1997-11-25 Immuno Ag SELECTION AND EXPRESSION OF FOREIGN PROTEINS BY MEANS OF A SELECTION-AMPLIFICATION SYSTEM
US6638762B1 (en) * 1994-11-28 2003-10-28 Genetic Therapy, Inc. Tissue-vectors specific replication and gene expression
IL116816A (en) 1995-01-20 2003-05-29 Rhone Poulenc Rorer Sa Cell for the production of a defective recombinant adenovirus or an adeno-associated virus and the various uses thereof
US5641870A (en) 1995-04-20 1997-06-24 Genentech, Inc. Low pH hydrophobic interaction chromatography for antibody purification
US5912167A (en) * 1995-06-06 1999-06-15 Wisconsin Alumni Research Foundation Autocatalytic cleavage site and use thereof in a protein expression vector
US6040183A (en) * 1995-06-07 2000-03-21 University Of North Carloina At Chapel Hill Helper virus-free AAV production
US6093570A (en) 1995-06-07 2000-07-25 The University Of North Carolina At Chapel Hill Helper virus-free AAV production
US6090382A (en) 1996-02-09 2000-07-18 Basf Aktiengesellschaft Human antibodies that bind human TNFα
SI9720020B (en) * 1996-02-09 2001-12-31 Basf Ag Human antibodies that bind human TNF alpha
CA2261987C (en) * 1996-07-22 2008-09-30 The Government Of The United States Of America, Represented By The Secre Tary, Department Of Health And Human Services Vectors for inhibiting hiv and tumor growth
US6962708B1 (en) * 1997-02-28 2005-11-08 Acambis, Inc. Chimeric flavivirus vaccines
US6849428B1 (en) * 1997-03-05 2005-02-01 New England Biolabs, Inc. Intein-mediated protein ligation of expressed proteins
US5981182A (en) * 1997-03-13 1999-11-09 Albert Einstein College Of Medicine Of Yeshiva University Vector constructs for the selection and identification of open reading frames
AU728220B2 (en) * 1997-04-14 2001-01-04 Cell Genesys, Inc. Methods for increasing the efficiency of recombinant AAV product
US6933378B2 (en) * 1997-05-30 2005-08-23 Joseph Atabekov Methods for coexpression of more than one gene in eukaryotic cells
US7007589B1 (en) 1997-09-15 2006-03-07 R. Sanderson Management, Inc. Piston assembly
FR2782325B1 (en) * 1998-08-12 2002-05-24 Proteus METHOD OF IDENTIFYING POLYNUCLEOTIDE SEQUENCES AND / OR CORRESPONDING PROTEINS FROM A SAMPLE OF NUCLEIC ACIDS
US20030099932A1 (en) * 1998-05-12 2003-05-29 Lorens James B. Retroviral vectors with separation sequences
US6537806B1 (en) * 1998-06-02 2003-03-25 University Of Washington Compositions and methods for treating diabetes
US7001745B1 (en) * 1998-09-30 2006-02-21 New England Biolabs, Inc. Intein mediated peptide ligation
KR20020007281A (en) * 1998-11-16 2002-01-26 링순 두안 Generation of antibodies using polynucleotide vaccination in avian species
AU3391900A (en) * 1999-03-05 2000-09-21 Maxygen, Inc. Encryption of traits using split gene sequences
CA2365981A1 (en) * 1999-03-24 2000-09-28 Board Of Regents, The University Of Texas System Linear and circular expression elements
US6914128B1 (en) * 1999-03-25 2005-07-05 Abbott Gmbh & Co. Kg Human antibodies that bind human IL-12 and methods for producing
US6933362B1 (en) 1999-08-17 2005-08-23 Rensselaer Polytechnic Institute Genetic system and self-cleaving inteins derived therefrom, bioseparations and protein purification employing same, and methods for determining critical, generalizable amino acid residues for varying intein activity
ES2252070T3 (en) * 1999-10-13 2006-05-16 Immunex Corporation VECTORS AND PROCEDURES FOR THE EXPRESSION OF RECOMBINANT PROTEINS.
DE60033965T2 (en) * 1999-10-29 2008-01-10 Kosan Biosciences, Inc., Hayward RAPAMYCIN ANALOG
US6665567B2 (en) * 2000-01-14 2003-12-16 Rainer R. Iraschko Optical-ring integer linear program formulation
ATE454456T1 (en) * 2000-02-11 2010-01-15 Metabolix Inc INTEIN CONTAINING MULTIGEN EXPRESSION CONSTRUCTS
US7378248B2 (en) 2000-03-06 2008-05-27 Rigel Pharmaceuticals, Inc. In vivo production of cyclic peptides for inhibiting protein-protein interaction
WO2001066565A2 (en) 2000-03-06 2001-09-13 Rigel Pharmaceuticals, Inc. In vivo production of cyclic peptides
AU2001247483A1 (en) * 2000-03-17 2001-10-03 Incyte Genomics, Inc. Proteases
US6692736B2 (en) * 2000-03-24 2004-02-17 Cell Genesys, Inc. Cell-specific adenovirus vectors comprising an internal ribosome entry site
US6908751B2 (en) * 2000-04-26 2005-06-21 Zymogenetics, Inc. Methods for enhancing the expression of a protein of interest by recombinant host cells
US6544780B1 (en) * 2000-06-02 2003-04-08 Genphar, Inc. Adenovirus vector with multiple expression cassettes
US6852510B2 (en) * 2000-07-03 2005-02-08 Gala Design Inc Host cells containing multiple integrating vectors
US20030036643A1 (en) 2000-09-14 2003-02-20 Jin Cheng He Methods and compositions for the construction and use of fusion libraries
US7419829B2 (en) * 2000-10-06 2008-09-02 Oxford Biomedica (Uk) Limited Vector system
US20040191786A1 (en) * 2001-02-16 2004-09-30 Yue David T. Three cube fret method (3-fret) for detecting fluorescence energy transfer
IL157378A0 (en) * 2001-03-09 2004-02-19 Genentech Inc Process for production of polypeptides
FI116851B (en) * 2001-05-03 2006-03-15 Fit Biotech Oyj Plc Expression vector, its uses and process for its preparation and products containing it
US7871814B2 (en) * 2001-05-10 2011-01-18 The Regents Of The University Of California Recombinant bicistronic flaviviruses and methods of use thereof
US20040180415A1 (en) * 2001-05-15 2004-09-16 Tchaga Grigoriy S. Methods and compositions for protein purification
US7052905B1 (en) * 2001-08-13 2006-05-30 University Of Kentucky Research Foundation Methods and composition for expressing multiple genes in plants by alternate splicing of a polycistronic message
EP1288891A1 (en) * 2001-08-27 2003-03-05 Hewlett-Packard Company Process and apparatus for displaying data in a specific area of the display in a computer or in an interactive terminal under control of the LAN card and independently on the operating system
WO2003040168A2 (en) * 2001-11-06 2003-05-15 Enanta Pharmaceuticals, Inc. Methods and compositions for identifying peptide aptamers capable of altering a cell phenotype
US20030157641A1 (en) * 2001-11-16 2003-08-21 Idec Pharmaceuticals Corporation Polycistronic expression of antibodies
US20040235011A1 (en) * 2002-06-26 2004-11-25 Cooper Richard K. Production of multimeric proteins
US20050112095A1 (en) * 2002-07-09 2005-05-26 Tsu-An Hsu Internal ribosome entry sites for recombinant protein expression
CN1263860C (en) * 2002-09-30 2006-07-12 华南农业大学 Construction method of multigene carrier and its application
US20050147962A1 (en) * 2002-11-19 2005-07-07 Wagstrom Christopher R. Display of dimeric proteins on phage
WO2004055215A1 (en) * 2002-12-18 2004-07-01 Chromagenics B.V. A method for improving protein production
WO2004101598A2 (en) * 2003-05-09 2004-11-25 Research Development Foundation Insertion of furin protease cleavage sites in membrane proteins and uses thereof
WO2005017149A1 (en) * 2003-06-03 2005-02-24 Cell Genesys, Inc. Compositions and methods for enhanced expression of recombinant polypeptides from a single vector using a peptide cleavage site
US7485291B2 (en) 2003-06-03 2009-02-03 Cell Genesys, Inc. Compositions and methods for generating multiple polypeptides from a single vector using a virus derived peptide cleavage site, and uses thereof
US20050136035A1 (en) * 2003-06-03 2005-06-23 Derek Ko Cell specific replication-competent viral vectors comprising a self processing peptide cleavage site
ATE429439T1 (en) * 2003-08-05 2009-05-15 Almac Sciences Scotland Ltd LIGATION PROCESS
CA2542951C (en) 2003-10-24 2016-08-30 Abhinav A. Shukla Process for purifying proteins in a hydrophobic interaction chromatography flow-through fraction
US7968684B2 (en) 2003-11-12 2011-06-28 Abbott Laboratories IL-18 binding proteins
US20050221429A1 (en) * 2004-01-16 2005-10-06 Cardinal Health Pts, Llc Host cells containing multiple integrating vectors comprising an amplifiable marker
US20090098611A1 (en) 2004-02-27 2009-04-16 Wood David W Self-cleaving affinity tags and methods of use
EP1765846A4 (en) * 2004-07-13 2010-02-17 Cell Genesys Inc Aav vector compositions and methods for enhanced expression of immunoglobulins using the same
EP1910550A4 (en) * 2005-07-21 2009-11-04 Abbott Lab Multiple gene expression including sorf constructs and methods with polyproteins, pro-proteins, and proteolysis
US20070041905A1 (en) 2005-08-19 2007-02-22 Hoffman Rebecca S Method of treating depression using a TNF-alpha antibody
BRPI0617688A2 (en) * 2005-10-21 2011-06-07 Hoffmann La Roche method for recombinant expression of a polypeptide
EP1783228A1 (en) * 2005-11-08 2007-05-09 ETH Zürich Recombinant expression of multiprotein complexes using polygenes
WO2008083493A1 (en) * 2007-01-10 2008-07-17 University Of Saskatchewan Stabilization of cyclic peptide structures
WO2008121324A2 (en) * 2007-03-30 2008-10-09 Abbott Laboratories Recombinant expression vector elements (reves) for enhancing expression of recombinant proteins in host cells

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11103932B2 (en) 2018-09-17 2021-08-31 Korea Institute Of Machinery & Materials Cutting head operated by centrifugal force and cutting apparatus including the same

Also Published As

Publication number Publication date
RU2012122240A (en) 2013-12-10
TW201124535A (en) 2011-07-16
CA2776990A1 (en) 2011-05-05
US20110150861A1 (en) 2011-06-23
MX2012005117A (en) 2012-06-14
JP2013509188A (en) 2013-03-14
CN102812040A (en) 2012-12-05
AU2010313395A1 (en) 2012-05-10
EP2493923A1 (en) 2012-09-05
IN2012DN03281A (en) 2015-10-23
WO2011053699A1 (en) 2011-05-05
IL219022A0 (en) 2012-06-28

Similar Documents

Publication Publication Date Title
RU2478709C2 (en) GENE SET EXPRESSION INCLUDING sORF CONSTRUCTS AND METHODS FOR IMMUNOGLOBULIN EXPRESSION
JP6087148B2 (en) Protein production method
AU2020306672B2 (en) Mammalian cell lines with SIRT-1 gene knockout
KR20120091251A (en) Sorf constructs and multiple gene expression
JP2019503179A (en) Hybrid promoter and use thereof
CA2611946C (en) Expression vector and methods of producing high levels of proteins
JP2022537202A (en) Methods for generating multivalent bispecific antibody-expressing cells by targeted integration of multiple expression cassettes of defined configuration
JP7410983B2 (en) Method for the generation of protein-expressing cells by targeted integration using Cre mRNA
JP7446342B2 (en) Method for generating cells expressing trivalent antibodies by targeted incorporation of multiple expression cassettes in a predetermined configuration
JP2022537333A (en) Methods for generating multivalent, multispecific antibody-expressing cells by targeted integration of multiple expression cassettes of defined configuration
CN114008081A (en) Method for generating bivalent bispecific antibody-expressing cells by targeted integration of multiple expression cassettes in defined tissue format

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid