본 발명은 적어도 부분적으로, 탄화수소의 생합성에 관여하는 단백질을 인코딩하는 여러 유전자의 발견에 기초한다. 본 발명에서 확인된 하나 이상의 단백질을 인코딩하는 하나 이상의 핵산 서열로 형질전환된 생물체는 탄화수소, 예를 들면, 올레핀, 그리고 탄화수소 중간물질, 예를 들면, 지방족 케톤을 산출하는데 이용될 수 있다. “올레핀”과 “알켄”은 본 명세서에서 동의어로서 이용된다. 본 명세서에 기술된 바와 같이, 이들 핵산 서열은 탄화수소의 생합성에 관여하는 유전자로서 확인되었다. 따라서 이들 유전자 중에서 하나 이상으로 형질전환된 세포는 올레핀과 이들의 전구체(가령, 지방족 케톤)를 비롯한 탄화수소의 생산을 위한 공급원으로서 이용될 수 있다. 이러한 발견은 한정된 재생불가능 탄화수소 자원(가령, 석유에 기초된 연료) 대신에 연료로서 이용될 수 있는 탄화수소에 대한 공급원을 제공한다. 이에 더하여, 이러한 발견은 특정 적용을 위하여 맞춤 설계된 광범위의 특유한 올레핀과 지방족 케톤 산물의 생산을 가능하게 한다. 숙주 생물체(host organism) 및/또는 반응 기질(reaction substrate)을 제어함으로써[가령, 사슬 길이(chain length), 가지화(branching), 포화(saturation) 및/또는 이중 결합의 위치를 제어함으로써], 특정 가지 또는 불포화 지점(point of unsaturation)을 보유하는 것들을 비롯한 광범위의 탄화수소 산물을 생산하는 생물체가 산출될 수 있다.
스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia)에서, 탄화수소, 예를 들면, 올레핀, 그리고 탄화수소 중간물질, 예를 들면, 지방족 케톤의 생합성에 관여하는 단백질을 각각 인코딩하는 4개의 유전자가 확인되었다. 이들 4개의 유전자는 oleA, oleB, oleC와 oleD로 지칭되고, 이들 유전자에 의해 인코딩되는 단백질은 각각, OleA, OleB, OleC와 OleD로 지칭된다. 이에 더하여, 이들 유전자는 또한, 다른 생물체 내에서 쌍으로 발견된다. 이러한 쌍에는 본 명세서에서 oleBC로서 지칭되는, oleB와 oleC 사이의 융합(fusion)이 포함되고, 상기 유전자에 의해 인코딩되는 단백질은 OleBC로서 지칭된다. 종합하면, 이들 5개의 단백질은 탄화수소와 탄화수소 중간물질의 생합성에 관여하는 Ole 단백질 집단을 대표한다. 개별적으로, OleA는 OleA 활성을 갖는 단백질 집단을 지칭하고, OleB는 OleB 활성을 갖는 단백질 집단을 지칭하고, OleC는 OleC 활성을 갖는 단백질 집단을 지칭하고, OleBC는 OleBC 활성을 갖는 단백질 집단을 지칭하고, OleD는 OleD 활성을 갖는 단백질 집단을 지칭한다. 당업자가 인식하는 바와 같이, 스테노트로포모나스 말토필리아(S. maltophilia) ole 유전자 서열의 구조와 기능에 관련하여 본 명세서에 제공된 정보를 이용함으로써, 유사한 활성을 갖는 단백질을 인코딩하는 다른 유전자 서열이 획득될 수 있다.
이들 교시를 고려하면, 당업자는 부가적인 oleA, oleB, oleC, oleBC와 oleD 서열이 탄화수소와 탄화수소 중간물질을 제조하기 위하여 용이하게 클로닝(cloning)되고 이용될 수 있음을 인식할 것이다. 이런 이유로, 본 명세서 전반에서, Ole 단백질에 대한 언급은 OleA, OleB, OleC, OleBC와 OleD를 비롯한 Ole 단백질 집단 중에서 임의의 하나와 유사한 활성을 나타내는 모든 단백질을 의미하는 것으로 이해되어야 한다. 유사하게, OleA, OleB, OleC, OleBC, 또는 OleD에 대한 언급은 예로써, 표 1과 2에 열거된 모든 OleA, OleB, OleC, OleBC와 OleD 단백질, 그리고 다양한 생물정보학적 방법(bioinformatic method) 또는 분자 기술(molecular technique), 이를테면, 항체 결합(antibody binding), 핵산 혼성화(nucleic acid hybridization), PCR과 다른 적합한 방법을 통하여 확인되거나 조작될 수 있는 다른 Ole 단백질을 비롯한 각 Ole 단백질의 개별 활성을 나타내는 모든 단백질을 의미하는 것으로 이해되어야 한다.
이에 더하여, 본 명세서 전반에서, ole 유전자에 대한 언급은 OleA, OleB, OleC, OleBC와 OleD를 비롯한 Ole 단백질 집단 중에서 임의의 하나와 유사한 활성을 나타내는 단백질을 인코딩하는 모든 유전자를 의미하는 것으로 이해되어야 한다. 유사하게, oleA, oleB, oleC, oleBC, 또는 oleD에 대한 언급은 예로써, 표 1과 2에 열거된 모든 OleA, OleB, OleC, OleBC와 OleD 단백질, 그리고 다양한 생물정보학적 방법(bioinformatic method) 또는 분자 기술(molecular technique), 이를테면, 항체 결합(antibody binding), 핵산 혼성화(nucleic acid hybridization), PCR과 다른 적합한 방법을 통하여 확인되거나 조작될 수 있는 다른 Ole 단백질을 비롯한 각 Ole 단백질의 개별 활성을 나타내는 단백질을 인코딩하는 모든 유전자를 의미하는 것으로 이해되어야 한다.
본 발명에서는 Ole 단백질을 인코딩하는 분리된 핵산을 제시한다. 핵산과 관련하여 “분리된”이라는 용어는 자연 환경(natural environment)으로부터 핵산의 이전(removal)을 지칭한다. 게다가, “분리된 핵산”은 단편으로서 자연적으로 발생하지 않고 자연에서 관찰되지 않는 핵산 단편을 포괄하는 것으로 의도된다. 본 명세서에서, “분리된”이라는 용어는 또한, 다른 세포 단백질로부터 분리된 폴리펩티드를 지칭하는데 이용되고, 정제된 폴리펩티드와 재조합 폴리펩티드를 둘 모두 포괄하는 것으로 의도된다. 본 명세서에서, “분리된”이라는 용어는 또한, 재조합 DNA 기술에 의해 생산될 때 세포 물질, 바이러스 물질, 또는 배양 배지가 실질적으로 존재하지 않는 핵산 또는 펩티드를 지칭하는데 이용된다. 본 명세서에서, “분리된”이라는 용어는 또한, 화학적으로 합성될 때 화학 전구체(chemical precursor) 또는 다른 화학물질이 실질적으로 존재하지 않는 핵산 또는 펩티드를 지칭하는데 이용된다.
“핵산”과 “핵산 서열”이라는 용어는 단일-가닥(single-strand) 또는 이중-가닥(double-strand)일 수 있고 비-자연 또는 변형된 뉴클레오티드를 내포할 수 있는, DNA 또는 RNA의 중합체(즉, 폴리뉴클레오티드)를 포괄하는 것으로 의도된다. 이들 용어는 또한, 뉴클레오티드 유사체(nucleotide analog)로부터 만들어진 RNA 또는 DNA의 유사체, 구체적으로, 단일[센스(sense) 또는 안티센스(antisense)] 및 이중-가닥 폴리뉴클레오티드, EST, 염색체, cDNA, mRNA와 rRNA를 등가물(equivalent)로서 포괄하는 것으로 이해되어야 한다.
표 1과 2에서는 Ole 단백질의 예시적인 목록을 제공한다. 표 1에서, #/#*는 생물체가 개별 실체를 갖는 2개의 동족체를 내포한다는 것을 지시한다. 굵은 글씨체로 표시된 생물체는 증명된 유전자 활성 또는 증명된 올레핀 생산을 보였다. 동일성 비율(percent identity)은 디폴트 파라미터(default parameter)로 설정된 BLAST™ 소프트웨어에 의한 계산으로, 스테노트로포모나스 말토필리아(S. maltophilia) ATCC 17679로부터 OleA, OleB, OleC, 또는 OleD의 아미노산 서열(표 1과 2에 지시된 바와 같음)과 비교하여 결정되었다. 가령, 두 핵산 서열 사이의 서열 동일성을 결정하기 위하여, 디폴트 파라미터{expect = 10, matrix = BLOSUM62, filter = DUST[Tatusov and Lipmann, unpublished data; and Hancock and Armstrong, Comput . Appl . Biosci, 10: 67-70 (1994)], gap existence cost = 11, per residue gap cost = 1, and lambda ratio = 0.85}로 설정된 Blastn(버전 2.0) 소프트웨어가 이용될 수 있다. 두 폴리펩티드의 비교를 위하여, 디폴트 파라미터{expect 10, filter = SEG[Wootton et al., Computers in Chemistry, 17: 149-163 (1993)], matrix = BLOSUM62, gap existence cost = 11, per residue gap cost = 1, lambda = 0.85}로 설정된 Blastp(버전 2.0) 소프트웨어가 이용될 수 있다.
본 발명에서는 탄화수소의 생합성에 관여하는 5가지 단백질 집단, 다시 말하면, OleA, OleB, OleC, OleBC와 OleD 단백질 집단을 제시하는데, 이들은 집합적으로, Ole 단백질 집단으로 지칭된다. OleA, OleB, OleC, OleBC와 OleD 단백질 집단에 속하는 단백질과 뉴클레오티드 서열을 확인하기 위하여, 생물정보학적 프로그램(bioinformatic program), 이를테면, BLAST 프로그램(NIH, Bethesda, MD 제공)이 이용되었다.
탄화수소 생합성에 관여할 가능성이 가장 높은 단백질을 확인하기 위하여, 이러한 생물정보학적 분석에 추가적인 제약이 가해졌다. 탄화수소 생합성은 단일 Ole 단백질에 의해 수행되지 않는다. 이런 이유로, 4개의 Ole 단백질을 모두 내포하는 생물체는 탄화수소를 생산할 가능성이 더욱 높다. 따라서 940개 이상의 세균 게놈, 뿐만 아니라 100개 이상의 고세균(archaeal)과 진핵세포(eukaryotic) 게놈에서 생물정보학적 분석이 수행되었다. 이러한 연구에서, 4개의 ole 탄화수소 합성 유전자를 모두 내포하는 67개의 세균 게놈이 확인되었다: 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) R551-3, 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) K279a, 아스로박터 아우레스켄스(Arthrobacter aurescens) TC1, 아스로박터 클로로페놀리쿠스(Arthrobacter chlorophenolicus) A6, 블라스토피렐룰라 마리나(Blastopirellula marina) DSM 3645, 브레위박테리움 리넨스(Brevibacterium linens) BL2, 디설포코커스 올레오보란스(Desulfococcus oleovorans) Hxd3, 클로로플렉서스 아그레간스(Chloroflexus aggregans) DSM 9485, 클로로플렉서스 아우란티아쿠스(Chloroflexus aurantiacus) J-10-fl, 클라비박터 미시가넨시스 아종 미시가넨시스(Clavibacter michiganensis subsp. michiganensis) NCPPB 382, 클라비박터 미시가넨시스 아종 세페도니쿠스(Clavibacter michiganensis subsp. Sepedonicus), 콜웰리아 사이크레리트래아(Colwellia psychrerythraea) 34H, 콘그레기박터 리토랄리스(Congregibacter litoralis) KT71, 디설포탈레아 사이크로필라(Desulfotalea psychrophila) LSv54, 디설푸로모나스 아세톡시단스(Desulfuromonas acetoxidans) DSM 684, 젬마타 옵스쿠리글로버스(Gemmata obscuriglobus) UQM 2246, 지오박터 베미드지엔시스(Geobacter bemidjiensis) Bem, 지오박터 로블레이(Geobacter lovleyi) SZ, 지오박터 종(Geobacter sp .) FRC-32, 지오박터 우라늄레두센스(Geobacter uraniumreducens) Rf4, 키네오코커스 라디오톨레란스(Kineococcus radiotolerans) SRS30216, 렌티스패라 아라네오사(Lentisphaera araneosa) HTCC2155, 미크로코커스 루테우스(Micrococcus luteus) NCTC 2665, 모리텔라 종(Moritella sp .) PE36, 오피투투스 테르라(Opitutus terrae) PB90-1, 펠로박터 프로피오니쿠스(Pelobacter propionicus) DSM 2379, 포토박테리움 프로푼둠(Photobacterium profundum) 3TCK, 포토박테리움 프로푼둠(Photobacterium profundum) SS9, 플랑크토미케스 마리스(Planctomyces maris) DSM 8797, 플레시오시스티스 파시피카(Plesiocystis pacifca) SIR-1, 사이크로모나스 인그라하밀(Psychromonas ingrahamii) 37, 사이크로모나스 종(Psychromonas sp .) CNPT3, 로도피렐룰라 발티카(Rhodopirellula baltica) SH 1, 쉬와넬라 아마조넨시스(Shewanella amazonensis) SB2B, 쉬와넬라 발티카(Shewanella baltica) OS155, 쉬와넬라 발티카(Shewanella baltica) OS185, 쉬와넬라 발티카(Shewanella baltica) OS195, 쉬와넬라 발티카(Shewanella baltica) OS223, 쉬와넬라 벤티카(Shewanella benthica) KT99, 쉬와넬라 데니트리피칸스(Shewanella denitrificans) OS217, 쉬와넬라 프리기디마리나(Shewanella frigidimarina) NCIMB 400, 쉬와넬라 할리팍센시스(Shewanella halifaxensis) HAW-EB4, 쉬와넬라 로이히카(Shewanella loihica) PV-4, 쉬와넬라 오네이덴시스(Shewanella oneidensis) MR-1, 쉬와넬라 페알레아나(Shewanella pealeana) ATCC 700345, 쉬와넬라 푸트레파시엔스(Shewanella putrefaciens) 200, 쉬와넬라 푸트레파시엔스(Shewanella putrefaciens) CN-32, 쉬와넬라 세디미니스(Shewanella sediminis) HAW-EB3, 쉬와넬라 종(Shewanella sp .) ANA-3, 쉬와넬라 종(Shewanella sp.) MR-4, 쉬와넬라 종(Shewanella sp .) MR-7, 쉬와넬라 종(Shewanella sp .) W3-18-1, 쉬와넬라 우디이(Shewanella woodyi) ATCC 51908, 스트렙토미세스 암보파시엔스(Streptomyces ambofaciens) ATCC 23877, 크산토모나스 악소노포디스(Xanthomonas axonopodis) pv. citri str. 306, 크산토모나스 캄페스트리스(Xanthomonas campestris) pv. campestris str. 8004, 크산토모나스 캄페스트리스(Xanthomonas campestris) pv. campestris str. B1OO, 크산토모나스 캄페스트리스(Xanthomonas campestris) pv. campestris str. ATCC 33913, 크산토모나스 캄페스트리스(Xanthomonas campestris) pv. vesicatoria str. 85-10, 크산토모나스 오리재(Xanthomonas oryzae) pv. oryzae KACC 10331, 크산토모나스 오리재(Xanthomonas oryzae) pv. oryzae MAFF 311018, 크산토모나스 오리재(Xanthomonas oryzae) pv. oryzicola BLS256, 크실렐라 파스티디오사(Xylella fastidiosa) 9a5c, 크실렐라 파스티디오사(Xylella fastidiosa) Ann-1, 크실렐라 파스티디오사(Xylella fastidiosa) Dixon, 크실렐라 파스티디오사(Xylella fastidiosa) M12, 크실렐라 파스티디오사(Xylella fastidiosa) M23, 그리고 크실렐라 파스티디오사(Xylella fastidiosa) Temecula1.
기존의 보고서에서는 탄화수소를 생산하는 다양한 생물체의 능력을 특성화하려고 시도하였지만, 이들 보고서는 확증될 수 없었다[예로써, Jones et al., J. Gen. Microbiol ., 59: 145-152 (1969), Ladygina et al., Process Biochemistry, 41 :1001-1014 (2006) 참조]. 비-이소프레노이드(non-isoprenoid) 탄화수소를 생산하는 생물체의 능력에 관하여 거의 보고된 바가 없긴 하지만, 기존 문헌에서 본 명세서에 기술된 유형의 올레핀을 생산하는 것으로 밝혀진 4가지 생물체가 존재한다: 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 클로로플렉서스(Chloroflexus) 종, 그리고 최근에 염기서열분석된 미크로코커스 루테우스(Micrococcus luteus)를 비롯한 다양한 미크로코커스(Micrococcus) 종[Tornabene et al., Can. J. Microbiol ., 24: 525-532 (1978); Suen et al., Journal of Industrial Microbiology, 2: 337-348 (1988); Morrison et al., J. Bacteriol ., 108: 353-358 (1971); van der Meer et al., Org . Geochem ., 30: 1585-1587 (1999); Albro et al., Biochemistry, 8: 394-404 (1969); Philips et al., Int . J. Syst. Evol . Microbiol ., 52: 933-938 (2002)].
이와 별개로, 생물정보학 검색(Bioinformatics searching)에서 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia)(R551-3과 K279a), 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 클로로플렉서스 아그레간스(Chloroflexus aggregans), 클로로플렉서스 아우란티아쿠스(Chloroflexus aurantiacus), 그리고 미크로코커스 루테우스(Micrococcus luteus)에서 4개의 ole 유전자가 확인되었다. 이에 더하여, 이들 생물체로부터 탄화수소(가령, 올레핀)의 생산이 확증되었다. 구체적으로, 이들 생물체 중에서 몇개로부터의 Ole 단백질은 탄화수소를 생산하는 능력에 대하여 조사되었다. 탄화수소를 생산하는 것으로 알려져 있는 2가지 생물체와 탄화수소를 생산하는 것으로 보고되진 않았지만 생물정보학 분석에서 확인된 2가지 생물체가 선별되고, 대장균(E. coli) 내에서 발현될 때 탄화수소를 생산하는 능력에 대하여 조사되었다.
실시예 6에서는 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 크사노토모나스 악소노포디스(Xanothomonas axonopodis), 그리고 클로로플렉서스 아그레간스(Chloroflexus aggregans)로부터의 OleA, OleC와 OleD 단백질 서열이 숙주, 이를테면, 대장균(E. coli) 또는 바실루스 메가테리움(Bacillus megaterium) 내에서 발현될 때 탄화수소를 생산하는 기능을 한다는 것을 보여준다. 이에 더하여, 플레시오시스티스 파시피카(Plesiocystis pacifica)로부터의 OleC 단백질 서열 역시 대장균(E. coli) 내에서 oleA와 oleD와 함께 발현될 때 탄화수소를 생산한다.
이들 유전자가 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia)에서 탄화수소 생산 능력을 공여하는 지를 확인하기 위하여, 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia)의 탄화수소 생산 균주에서 oleA, oleC와 oleD의 결실 돌연변이를 만들었다. oleA가 결실된 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia)의 결실 돌연변이체는 여하한 탄화수소를 생산하지 못하고, oleC 또는 oleD가 결실된 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia)의 결실 돌연변이체는 탄화수소를 생산하지 못하지만, 그 대신에 지방족 케톤을 생산한다.
생물정보학을 이용하여, 각 Ole 단백질의 보존된 영역을 확인함으로써 Ole 아미노산 모티프가 설계될 수 있다. 이들 아미노산 모티프는 단백질 정렬(protein alignment)과 그 이후에, 이들 단백질 서열의 시각적 점검(visual inspection)에 의해 설계될 수 있다. 이들 아미노산 모티프는 이후, Ole 단백질과 유사한 생물학적 기능을 갖는 단백질을 확인하는데 이용될 수 있다. 당분야에 널리 공지된 여러 프로그램으로 이들 아미노산 모티프를 이용하여 기능성 단백질 집단에 속하는 단백질을 확인할 수 있다. 가령, 이와 같은 공개 프로그램의 하나는 http://motif.genome.jp/motif2.html이다(실시예 7 참조).
이들 실험 데이터에 기초하여, 4개의 ole 유전자를 모두 내포하는 생물체가 탄화수소를 생산하는 능력을 가질 가능성이 가장 높을 것으로 예측되었다. 이런 이유로, 4개의 Ole 단백질을 모두 내포하는 67개 생물체(예로써 표 1 참조)로부터 모든 OleA, OleB, OleC와 OleD 단백질 서열을 수집함으로써 이들 아미노산 모티프가 산출되었다. 단백질 융합체, 이를테면, OleBC 단백질의 경우에, OleB 섹션(section)은 OleB 단백질 서열과 함께 정렬되고, OleC 섹션은 OleC 단백질 서열과 함께 정렬되었다. 부분적 게놈 서열 또는 가능한 게놈 재조합(recombination)을 포함하는 생물체는 표 1에 포함되지 않았고, 따라서 이들 아미노산 모티프를 설계하는데 이용되지 않았다. 4개의 ole 유전자를 모두 내포하는 이들 67개 생물체의 보존된 영역에 기초하여, 이들 아미노산 모티프를 내포하는 다른 폴리펩티드 서열은 기능성 Ole 단백질일 것으로 예측된다. 4개의 ole 유전자를 내포하는 67개 생물체로부터 설계된 아미노산 모티프는 표 3 내지 6에 열거된다. 예측된 모티프 모두에서, 아래첨자 번호(subscript numbering)는 모티프 내에서 아미노산의 위치를 표시한다. X는 임의의 아미노산(가령, 임의의 자연 발생 아미노산)을 나타내고, 괄호안의 항목은 지정된 위치에 대한 아미노산 잔기의 선택을 반영한다. 가령, [LF]1은 잔기 위치 1에서 L 또는 F를 의미한다.
탄화수소를 생산하는 생물체를 확인하는 공개된 문헌과 함께, 이들 생물체 역시 4개의 ole 유전자를 모두 내포한다는 것을 나타내는 생물정보학 데이터를 더욱 고려함으로써 부가적인 아미노산 모티프가 개발되었다. 게다가, 4개의 ole 유전자를 모두 내포하는 조사된 특정 생물체가 탄화수소를 생산한다는 것을 증명하는 실험 데이터를 이용하여 이들 모티프가 개발되었다. 이들 아미노산 모티프는 표 7 내지 9에 열거된다.
최종적으로, ole 유전자가 대장균(E. coli) 내에서 이종 발현되고 탄화수소 생산에서 일정한 역할을 하는 것으로 확증된 생물체로부터 Ole 단백질 서열을 정렬함으로써 부가적인 아미노산 모티프가 개발되었다(예로써, 실시예 6 참조). 이들 아미노산 모티프는 표 10 내지 12에 열거된다.
본 발명은 OleA, OleB, OleC, 또는 OleD 아미노산 모티프 서열을 포함하는 폴리펩티드를 인코딩하는 분리된 핵산에 관계한다. 가령, 분리된 핵산은 SEQ ID NO: 64-74와 91-133으로 구성된 군에서 선택되는 아미노산 서열을 포함하는 폴리펩티드를 인코딩할 수 있다.
분리된 핵산은 OleA 아미노산 모티프 서열을 포함하는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 64-69, 98-102, 그리고 116-120으로 구성된 군에서 선택되는 아미노산 서열을 포함하는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 OleB 아미노산 모티프 서열을 포함하는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 91-97로 구성된 군에서 선택되는 아미노산 서열을 포함하는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 OleC 아미노산 모티프 서열을 포함하는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 72-74, 103-108, 그리고 121-126으로 구성된 군에서 선택되는 아미노산 서열을 포함하는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 OleD 아미노산 모티프 서열을 포함하는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 70, 71, 109-115, 그리고 127-133으로 구성된 군에서 선택되는 아미노산 서열을 포함하는 폴리펩티드를 인코딩할 수 있다.
분리된 핵산은 OleA, OleB, OleC, 또는 OleD 아미노산 모티프 서열 중에서 하나 이상을 포함하는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 1개, 2개, 3개, 또는 4개의 Ole 아미노산 모티프 서열을 포함하는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 OleB 아미노산 모티프 서열과 OleC 아미노산 모티프 서열을 포함하는 폴리펩티드를 인코딩할 수 있다.
대안으로, 분리된 핵산은 Ole 아미노산 모티프 서열을 포함하는 하나 이상의 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 제 1 폴리펩티드와 제 2 폴리펩티드를 인코딩할 수 있고, 여기서 제 1 및 제 2 폴리펩티드는 각각, Ole 아미노산 모티프 서열을 포함하거나, 또는 제 1 및 제 2 폴리펩티드는 각각, SEQ ID NO: 64-74와 91-133으로 구성된 군에서 선택되는 아미노산 서열을 포함한다. 분리된 핵산은 제 1 폴리펩티드, 제 2 폴리펩티드와 제 3 폴리펩티드를 인코딩할 수 있고, 여기서 제 1, 제 2 및 제 3 폴리펩티드는 각각, Ole 아미노산 모티프 서열을 포함한다. 가령, 분리된 핵산은 제 1 폴리펩티드, 제 2 폴리펩티드와 제 3 폴리펩티드를 인코딩할 수 있고, 여기서 제 1, 제 2 및 제 3 폴리펩티드는 각각, SEQ ID NO: 64-74와 91-133으로 구성된 군에서 선택되는 아미노산 서열을 포함한다. 분리된 핵산은 제 1 폴리펩티드, 제 2 폴리펩티드, 제 3 폴리펩티드와 제 4 폴리펩티드를 인코딩할 수 있고, 여기서 제 1 , 제 2, 제 3과 제 4 폴리펩티드는 각각, Ole 아미노산 모티프 서열을 포함한다. 가령, 분리된 핵산은 제 1 폴리펩티드, 제 2 폴리펩티드, 제 3 폴리펩티드와 제 4 폴리펩티드를 인코딩할 수 있고, 여기서 제 1, 제 2, 제 3 및 제 4 폴리펩티드는 SEQ ID NO: 64-74와 91-133으로 구성된 군에서 선택되는 아미노산 서열을 포함한다.
바람직하게는, 분리된 핵산은 Ole 아미노산 모티프 서열을 포함하는 1500개 이하의 아미노산 잔기의 폴리펩티드를 인코딩한다. 가령, 분리된 핵산은 SEQ ID NO: 64-74와 91-133으로 구성된 군에서 선택되는 아미노산 서열을 포함하는 1500개 이하의 아미노산 잔기의 폴리펩티드를 인코딩할 수 있다. 다른 구체예에서, 제 1 및 제 2 폴리펩티드는 각각, 1500개 이하의 아미노산 잔기이거나, 제 1, 제 2 및 제 3 폴리펩티드는 각각, 1500개 이하의 아미노산 잔기이거나, 또는 제 1, 제 2, 제 3 및 제 4 폴리펩티드는 각각, 1500개 이하의 아미노산 잔기이다.
이들 ole 유전자를 생물정보학 분석에서, 이들 유전자가 오페론(operon)내에서처럼 동일한 방향으로 전사된 5000개 내지 10000개의 염기쌍(base pair) 영역 내에서 발견되는 것으로 밝혀졌다. 이들 유전자는 또한, 생물체 내에서 쌍으로 발견된다. 이러한 쌍에는 OleB과 OleC 사이의 단백질 융합(이후, OleBC)이 포함된다. 가령, oleBC 유전자 융합은 앞서 기술된 67개 생물체 중에서 7개에서 관찰되었다: 아스로박터 아우레스켄스(Arthrobacter aurescens), 양쪽 클라비박터 미시가넨시스(Clavibacter michiganensis) 종, 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 브레위박테리움 리넨스(Brevibacterium linens), 콘그레기박터 리토랄리스(Congregibacter litoralis), 그리고 미크로코커스 루테우스(Micrococcus luteus).
하나 이상의 ole 유전자(들)를 내포하는 생물체의 확인은 상기 생물체가 탄화수소를 자연적으로 생산한다는 것을 암시한다. 이들 유전자 집단에 속하는 유전자를 내포하는 다른 염기서열분석된 생물체(예로써, 표 1과 2 참조)를 확인하기 위하여 생물정보학 기술이 이용되었다. 이들 유전자는 그들의 숙주 생물체 뿐만 아니라 다른 숙주 생물체에서 발현될 때 다른 숙주에 탄화수소 생산을 공여하는데 이용될 수 있다. 당업자는 부가적인 oleA, oleB, oleC, oleD와 oleBC 서열이 탄화수소와 탄화수소 중간물질을 제조하기 위하여 용이하게 클로닝되고 이용될 수 있음을 인식할 것이다. 본 발명에서 개시된 방법을 이용하여 확인된 OleA, OleB, OleC, OleD와 OleBC 단백질의 전형적인 목록은 표 1과 2에서 찾아볼 수 있다. 당업자는 표 1과 2에 열거된 OleA, OleB, OleC, OleD와 OleBC 단백질 서열로부터 유전자 서열을 확인하거나 추론할 수 있을 것이다.
본 발명은 (a) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열; (b) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 보존성 변이체; 및 (d) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열에 대하여 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩하는 분리된 핵산에 관계한 것이다.
가령, 분리된 핵산은 (a) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487; (b) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 보존성 변이체; (d) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되거나, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다,
분리된 핵산은 OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다, 적절하게는, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22와 SEQ ID NO: 88로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleA 아미노산 서열을 포함하거나, 이러한 아미노산 서열로 필수적으로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12, SEQ ID NO: 18과 SEQ ID NO: 150-229로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12와 SEQ ID NO: 18로 구성된 군에서 선택되는 아미노산 서열을 포함하는, 필수적으로 이러한 아미노산 서열로 구성되거나, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleB 아미노산 서열을 포함하는, 필수적으로 이러한 아미노산서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 10과 SEQ ID NO: 230-326으로 구성된 군에서 선택되는 아미노산 서열을 포함하는, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 10을 포함하는, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 아미노산 서열을 포함하는, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleC 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20, SEQ ID NO: 88과 SEQ ID NO: 327-402로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20과 SEQ ID NO: 88로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleD 아미노산 서열을 포함하는, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 8, SEQ ID NO: 16, SEQ ID NO: 22, SEQ ID NO: 142-149와 SEQ ID NO: 403-464로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 8, SEQ ID NO: 16과 SEQ ID NO: 22로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleBC 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 135-141로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
분리된 핵산은 OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 동족체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22와 SEQ ID NO: 88의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleA의 동족체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12, SEQ ID NO: 18과 SEQ ID NO: 150-229의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12와 SEQ ID NO: 18의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleB의 동족체인 아미노산 서열을 포함하는, 이러한 아미노산 서열로 필수적으로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 10과 SEQ ID NO: 230-326의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 10의 동족체를 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleC의 동족체인 아미노산 서열을 포함하는, 이러한 아미노산 서열로 필수적으로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20, SEQ ID NO: 88과 SEQ ID NO: 327-402의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20과 SEQ ID NO: 88의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleD의 동족체인 아미노산 서열을 포함하거나, 이러한 아미노산 서열로 필수적으로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 8, SEQ ID NO: 16, SEQ ID NO: 22, SEQ ID NO: 142-149와 SEQ ID NO: 403-464의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 8, SEQ ID NO: 16과 SEQ ID NO: 22의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleBC의 동족체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 135-141의 동족체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
OleA, OleB, OleC, OleD, 또는 OleBC 단백질의 동족체는 예로써, 탄화수소 신타아제 활성(hydrocarbon synthase activity)의 관점에서, OleA, OleB, OleC, OleD, 또는 OleBC 단백질에서와 실질적으로 유사한 기능을 수행한다. 가령, OleA, OleB, OleC, OleD, 또는 OleBC 단백질, 그리고 OleA, OleB, OleC, OleD, 또는 OleBC 단백질 동족체는 반드시 유사한 아미노산 서열을 보유할 필요는 없다. 하지만, 이들은 유사한 탄화수소 신타아제 활성을 갖는다.
두 서열 사이의 “상동성(homology)” 계산은 아래와 같이 수행될 수 있다. 이들 서열은 최적 비교 목적으로 정렬된다(가령, 최적 정렬을 위하여 제 1 및 제 2 아미노산 또는 핵산 서열 중에서 한쪽 또는 양쪽에 갭(gap)이 도입될 수 있고, 비-상동성 서열은 비교 목적을 위하여 무시될 수 있다). 바람직한 구체예에서, 비교 목적으로 정렬되는 참고 서열(reference sequence)의 길이는 이러한 참고 서열의 길이의 적어도 대략 30%, 바람직하게는, 적어도 대략 40%, 더욱 바람직하게는, 적어도 대략 50%, 이보다 더욱 바람직하게는, 적어도 대략 60%, 그리고 이보다 더욱 바람직하게는, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 90%, 또는 대략 100%이다. 이후, 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드가 비교된다. 제 1 서열에서 위치가 제 2 서열에서의 상응한는 위치로서 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유되면, 이들 분자는 상기 위치에서 동일하다(본 명세서에서 사용되는 바와 같이, 아미노산 또는 핵산 “동일성(identity)”은 아미노산 또는 핵산 “상동성”과 같음). 두 서열 사이의 동일성 비율(percent identity)은 이들 두 서열의 최적 정렬을 위하여 도입될 필요가 있는, 갭의 숫자와 각 갭의 길이를 고려하여, 이들 서열에 의해 공유되는 동일한 위치의 숫자의 함수이다.
분리된 핵산은 OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 보존성 변이체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22와 SEQ ID NO: 88의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleA 아미노산 서열의 보존성 변이체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12, SEQ ID NO: 18과 SEQ ID NO: 150-229의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12와 SEQ ID NO: 18의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleB 아미노산 서열의 보존성 변이체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 10과 SEQ ID NO: 230-326의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 10의 보존성 변이체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleC 아미노산 서열의 보존성 변이체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20, SEQ ID NO: 88과 SEQ ID NO: 327-402의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20과 SEQ ID NO: 88의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleD 아미노산 서열의 보존성 변이체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 8, SEQ ID NO: 16, SEQ ID NO: 22, SEQ ID NO: 142-149와 SEQ ID NO: 403-464의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 8, SEQ ID NO: 16과 SEQ ID NO: 22의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleBC 아미노산 서열의 보존성 변이체인 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 SEQ ID NO: 135-141의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
본 명세서에서, 폴리펩티드 X의 “변이체(variant)”는 하나 이상의 아미노산 잔기가 변경된 펩티드 X의 아미노산 서열을 보유하는 폴리펩티드를 지칭한다. 변이체는 보존성 변화(conservative change) 또는 비-보존성 변화(non-conservative change)를 보유할 수 있다. 생물학적 활성에 영향을 주지 않으면서 어떤 아미노산 잔기가 치환, 삽입, 또는 결실될 수 있는 지를 결정하는데 있어 가이던스(guidance)는 당분야에 널리 공지된 컴퓨터 프로그램, 예를 들면, LASERGENE 소프트웨어(DNASTAR)를 이용하여 발견될 수 있다.
폴리뉴클레오티드 서열의 배경에서, “변이체”는 유전자 서열 또는 이의 코딩 서열(coding sequence)에 관련된 폴리뉴클레오티드 서열을 포괄한다. 이러한 정의에는 예로써, “대립형질(allelic)”, “절단접합(splice)” “종(species)”. 또는 “다형성(polymorphic)” 변이체 역시 포함된다. 절단접합 변이체(splice variant)는 참고 폴리뉴클레오티드에 현저한 동일성을 갖지만, mRNA 가공 동안 엑손(exon)의 택일적 절단접합(alternative splicing)으로 인하여 일반적으로, 더욱 많은 또는 더욱 적은 숫자의 폴리뉴클레오티드를 보유할 것이다. 상응하는 폴리펩티드는 부가적인 기능성 도메인을 보유하거나, 또는 도메인이 부재할 수 있다. 종 변이체는 종에 따라 달라지는 폴리뉴클레오티드 서열이다. 생성된 폴리펩티드는 일반적으로, 서로에 대하여 현저한 아미노산 동일성을 가질 것이다. 다형성 변이체는 일정한 종의 개체 간에 특정 유전자의 폴리뉴클레오티드 서열에서 변이이다.
보존된 아미노산 치환은 표 13에 열거된 임의의 아미노산 치환일 수 있다. 구체적으로, 보존된 아미노산 치환은 알라닌(alanine)에서 D-Ala, Gly, 베타-Ala, L-Cys, D-Cys로 치환; 아르기닌(arginine)에서 D-Arg, Lys, D-Lys, 호모-Arg, D-호모-Arg, Met, Ile, D-Met, D-Ile, Orn, D-Orn으로 치환; 아스파라긴(asparagine)에서 D-Asn, Asp, D-Asp, Glu, D-Glu, Gln, D-Gln으로 치환; 아스파라긴산(aspartic acid)에서 D-Asp, D-Asn, Asn, Glu, D-Glu, Gln, D-Gln으로 치환; 시스테인(cysteine)에서 D-Cys, S-Me-Cys, Met, D-Met, Thr, D-Thr로 치환; 글루타민산(glutamic acid)에서 D-Glu, D-Asp, Asp, Asn, D-Asn, Gln, D-Gln으로 치환; 글리신(glycine)에서 Ala, D-Ala, Pro, D-Pro, b-Ala, Acp로 치환; 이소루이신(isoleucine)에서 D-Ile, Val, D-Val, Leu, D-Leu, Met, D-Met으로 치환; 루이신(leucine)에서 D-Leu, Val, D-Val, Leu, D-Leu, Met, D-Met으로 치환; 리신(lysine)에서 D-Lys, Arg, D-Arg, 호모-Arg, D-호모-Arg, Met, D-Met, Ile, D-Ile, Orn, D-Orn으로 치환; 메티오닌(methionine)에서 D-Met, S-Me-Cys, Ile, D-Ile, Leu, D-Leu, Val, D-Val로 치환; 페닐알라닌(phenylalanine)에서 D-Phe, Tyr, D-Thr, L-Dopa, His, D-His, Trp, D-Trp, Trans-3, 4, 또는 5-페닐프롤린, cis-3, 4, 또는 5-페닐프롤린으로 치환; 프롤린(proline)에서 D-Pro, L-1-티오아졸리딘-4-카르복실산, D- 또는 L-1-옥사졸리딘-4-카르복실산으로 치환; 세린(serine)에서 D-Ser, Thr, D-Thr, allo-Thr, Met, D-Met, Met(O), D-Met(O), L-Cys, D-Cys로 치환; 트레오닌(threonine)에서 D-Thr, Ser, D-Ser, allo-Thr, Met, D-Met, Met(O), D-Met(O), Val, D-Val로 치환; 티로신(tyrosine)에서 D-Tyr, Phe, D-Phe, L-Dopa, His, D-His로 치환; 발린(valine)에서 D-Val, Leu, D-Leu, Ile, D-Ile, Met, D-Met로 치환으로 구성된 군에서 선택될 수 있다.
Ole 단백질의 보존성 변이체는 하나 이상의 보존된 아미노산 치환을 포함할 수 있다. 가령, 보존성 변이체는 대략 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 또는 50개의 보존된 아미노산 치환을 보유할 수 있다. 바람직한 구체예에서, 보존성 변이체는 대략 50개 이하의 보존된 아미노산 치환을 보유한다. 가령, 보존성 변이체는 대략 3개, 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 또는 50개 이하의 보존된 아미노산 치환을 보유할 수 있다. SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 보존성 변이체는 아미노산 치환 없이 개별 아미노산 서열에서와 실질적으로 유사한 기능을 수행한다. 본 명세서에서 제시된 분석법 중에서 한 가지를 이용하여 활성을 평가할 수 있다. 일부 실례에서, OleA 단백질의 보존성 변이체는 탄화수소 신타아제 활성, 예를 들면, 아실 축합 활성(acyl condensing activity), 지방족 케톤 신타아제 활성 및/또는 올레핀 신타아제 활성에 대하여 분석될 수 있다. 본 명세서에서, “신타아제(synthase)”는 합성 과정을 촉진하는 효소를 지칭한다. 본 명세서에서, 신타아제에는 신타아제, 신스타아제(synthetase), 그리고 리가아제(ligase)가 포함된다.
다른 실례에서, OleC와 OleD의 보존성 변이체는 본 명세서에 기술된 바와 같이 활성에 대하여 분석될 수 있다. 이러한 보존성 변이체는 상기 단백질의 활성이 유지되는 조건에서, 아미노산 서열에서 예로써, 대략 1개의 보존된 아미노산 치환, 2개의 아미노산 치환, 3개의 아미노산 치환, 4개의 아미노산 치환, 또는 5개 또는 그 이상의 아미노산 치환을 보유할 수 있다.
바람직하게는, 분리된 핵산은 Ala에서 Cys, Gly, 또는 Ser로 치환; Arg에서 Ile, Lys, Met, 또는 Orn으로 치환; Asn에서 Asp, Gln, Glu, 또는 His로 치환; Asp에서 Asn, Gln, 또는 Glu로 치환; Cys에서 Met, Ser, 또는 Thr로 치환; Gln에서 Asn, Asp, 또는 Glu로 치환; Glu에서 Asn, Asp, 또는 Gln으로 치환; Gly에서 Acp, Ala, 또는 Pro로 치환; His에서 Asn 또는 Gln으로 치환; Ile에서 Leu, Met, 또는 Val로 치환; Leu에서 Ile, Met, 또는 Val로 치환; Lys에서 Arg, Gln, Glu, Ile, Met, 또는 Orn으로 치환; Met에서 Cys, Ile, Leu, 또는 Val로 치환; Phe에서 His, L-Dopa, Leu, Met, Thr, Trp, Tyr, 3-페닐프롤린, 4-페닐프롤린, 또는 5-페닐프롤린으로 치환; Pro에서 L-1-티오아졸리딘-4-카르복실산, 또는 D- 또는 L-1-옥사졸리딘-4-카르복실산으로 치환; Ser에서 Cys, Met, 또는 Thr로 치환; Thr에서 Met, Ser, 또는 Val로 치환; Trp에서 Tyr로 치환; Tyr에서 L-Dopa, His, 또는 Phe로 치환; 그리고 Val에서 Ile, Leu, 또는 Met로 치환, 으로 구성된 군에서 선택되는 하나 이상의 보존된 아미노산 치환을 포함하는, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6. SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22와 SEQ ID NO: 88의 보존성 변이체로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
일부 구체예에서, 보존성 변이체는 그 자신이 유래된 서열과 비교하여 하나 이상의 보존성 아미노산 치환을 보유하면서도 개별 활성을 유지한다. 가령, 보존성 변이체는 그 자신이 유래된 모체(parent) 단백질의 생물학적 활성의 적어도 대략 10%, 또는 대안으로, 모체 단백질의 생물학적 활성의 적어도 대략 20%, 적어도 대략 30%, 또는 적어도 대략 40%를 유지할 수 있다. 일부 바람직한 구체예에서, 보존성 변이체는 그 자신이 유래된 모체 단백질의 생물학적 활성의 적어도 대략 50%를 유지한다. 보존성 변이체의 보존성 아미노산 치환은 상기 단백질의 임의의 도메인에서 발생할 수 있다. 다른 구체예에서, 보존된 아미노산 치환은 모체 단백질과 비교하여 강화된 생물학적 활성을 결과할 수 있다. 가령, 보존성 변이체는 그 자신이 유래된 모체 단백질의 생물학적 활성의 적어도 대략 100%, 또는 대안으로, 그 자신이 유래된 모체 단백질의 생물학적 활성의 적어도 대략 110%, 적어도 대략 120%, 적어도 대략 150%, 적어도 대략 200%, 또는 적어도 대략 1000%의 생물학적 활성을 가질 수 있다.
분리된 핵산은 OleA, OleB, OleC, OleD, 또는 OleBC에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 바람직하게는, 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22와 SEQ ID NO: 88에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩한다.
분리된 핵산은 OleA에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12, SEQ ID NO: 18과 SEQ ID NO: 150-229에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
분리된 핵산은 OleB에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 SEQ ID NO: 10과 SEQ ID NO: 230-326에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
분리된 핵산은 OleC에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20, SEQ ID NO: 88과 SEQ ID NO: 327-402에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
분리된 핵산은 OleD에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 동일성을 갖는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 SEQ ID NO: 8, SEQ ID NO: 16, SEQ ID NO: 22, SEQ ID NO: 142-149와 SEQ ID NO: 403-464에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
분리된 핵산은 OleBC에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 SEQ ID NO: 135-141에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
Ole 단백질을 인코딩하는 아미노산 서열에 대략 35% 내지 대략 100%의 서열 동일성을 갖는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩하는 분리된 핵산 역시 본 발명에서 제시된다. 가령, 분리된 핵산은 Ole 단백질을 인코딩하는 아미노산 서열에 적어도 대략 35%, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드를 인코딩할 수 있다.
탄화수소와 탄화수소 중간물질을 형성하는 핵산과 아미노산 서열의 특정 구체예가 개시되고 있긴 하지만, 유사한 구조적 특징을 갖는 서열이 다른 생물체로부터 분리될 수 있다. 이들 새로 분리된 서열은 탄화수소 신타아제 활성에 대하여 분석될 수 있다(관련된 서열의 무제한적 특정 실례의 목록에 대하여 표 1과 2 참조). 이에 더하여, 본 발명에서 개시된 핵산과 아미노산 서열의 다른 기능적으로 등가의 형태는 예로써, 특정-부위 돌연변이유발(site-directed mutagenesis), M13 프라이머 돌연변이유발(primer mutagenesis), 오류 허용성(error prone) PCR, 유성(sexual) PCR, DNA 합성, 또는 DNA 뒤섞기(shuffling)를 비롯한 전통적인 분자 생물학적 기술을 이용하여 용이하게 확인되고 및/또는 산출될 수 있다. 이들 많은 기술의 상세한 내용은 Sambrook et al., Molecular Cloning: A Laboratory Manual, 3rd ed., vol. 1-3, Cold Spring Harbor, New York (2000)에서 제공된다.
따라서 구조적으로 관련된 서열과 상동성 서열 이외에, 본 발명은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88 및/또는 SEQ ID NO: 135-464에 적어도 대략 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열 역시 포괄한다. 다른 구체예에서, 본 발명은 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88 및/또는 SEQ ID NO: 135-464에 적어도 대략 96%, 97%, 98%, 99%, 또는 99.5% 서열 동일성을 갖는 아미노산 서열을 포괄한다.
OleA, OleB, OleC, OleBC와 OleD에 구조적, 기능적 유사성을 유지하는 서열은 다수의 공지된 방법에 의해 확인될 수 있다. 한 가지 이와 같은 방법은 공지된 서열과의 서열 정렬을 위한 게놈 서열의 스크리닝(screening)을 수반한다. 비교를 위하여 서열을 정렬하는 방법은 당분야에 널리 공지되어 있다. 다양한 프로그램과 정렬 알고리즘(alignment algorithm)은 Smith et al., Adv . Appl . Math, 2: 482 (1981); Needleman et al., J MoI . Biol, 48: 443 (1970); Pearson et al., Proc . Natl. Acad . Sci, USA, 85: 2444 (1988); Higgins et al., Gene, 73: 237-244 (1988); Higgins & Sharp, CABIOS, 5: 151-153 (1989); Corpet et al., Nucleic Acids Research, 16: 10881-10890 (1988); Huang et al., CABIOS, 8: 155-165 (1992); Pearson et al., Methods in Molecular Biology, 24: 307-331 (1994)에 기재되어 있다. Altschul et al, J MoI . Biol, 215: 403-410 (1990)은 서열 정렬 방법과 상동성 계산의 상세한 설명을 제공한다.
바람직한 구체예에서, 두 아미노산 서열 사이의 상동성 비율은 BLOSUM62 매트릭스(matrix) 또는 PAM250 매트릭스, 그리고 16, 14, 12, 10, 8, 6, 또는 4의 갭 가중(gap weight)과 1, 2, 3, 4, 5, 또는 6의 길이 가중(length weight)을 이용하는, GCG 소프트웨어 패키지에서 GAP 프로그램에 통합되는 Needleman(상기) 알고리즘을 이용하여 결정된다. 또 다른 바람직한 구체예에서, 두 뉴클레오티드 서열 사이의 상동성 비율은 NWSgapdna.CMP 매트릭스와 40, 50, 60, 70, 또는 80의 갭 가중과 1, 2, 3, 4, 5, 또는 6의 길이 가중을 이용하는, GCG 소프트웨어 패키지에서 GAP 프로그램을 이용하여 결정된다. 특히 바람직한 일단의 파라미터(그리고 분자가 클레임(claim)의 상동성 제한 내에 있는 지를 결정하기 위하여 어떤 파라미터가 적용되어야 하는 지에 대하여 수행자가 확신이 없는 경우에 이용되는 파라미터)는 12의 갭 페널티(gap penalty), 4의 갭 연장 페널티(gap extend penalty), 그리고 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 내포하는 BLOSUM62 스코어링 매트릭스(scoring matrix)이다.
본 발명에서는 또한, 하나 이상의 폴리펩티드를 인코딩하는 분리된 핵산을 제시하는데, 여기서 각 폴리펩티드는 (a) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열; (b) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 보존성 변이체; 그리고 (d) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되거나, 또는 이러한 아미노산 서열로 구성된다. 분리된 핵산은 제 1 폴리펩티드와 제 2 폴리펩티드를 인코딩할 수 있는데, 여기서 제 1 및 제 2 폴리펩티드는 각각, (a) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열; (b) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 보존성 변이체; 그리고 (d) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되거나, 또는 이러한 아미노산 서열로 구성된다. 가령, 분리된 핵산은 제 1 폴리펩티드와 제 2 폴리펩티드를 인코딩할 수 있는데, 여기서 제 1 및 제 2 폴리펩티드는 각각, (a) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487; (b) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 보존성 변이체; 그리고 (d) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되거나, 또는 이러한 아미노산 서열로 구성된다.
분리된 핵산은 제 1 폴리펩티드, 제 2 폴리펩티드와 제 3 폴리펩티드를 인코딩할 수 있는데, 여기서 제 1, 제 2 및 제 3 폴리펩티드는 각각, (a) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열; (b) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 보존성 변이체; 그리고 (d) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되거나, 또는 이러한 아미노산 서열로 구성된다. 가령, 분리된 핵산은 제 1 폴리펩티드, 제 2 폴리펩티드와 제 3 폴리펩티드를 인코딩할 수 있는데, 여기서 제 1, 제 2 및 제 3 폴리펩티드는 각각, (a) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487; (b) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 보존성 변이체; 그리고 (d) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되거나, 또는 이러한 아미노산 서열로 구성된다.
분리된 핵산은 제 1 폴리펩티드, 제 2 폴리펩티드, 제 3 폴리펩티드와 제 4 폴리펩티드를 인코딩할 수 있는데, 여기서 제 1, 제 2, 제 3 및 제 4 폴리펩티드는 각각, (a) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열; (b) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열의 보존성 변이체; 그리고 (d) OleA, OleB, OleC, OleD, 또는 OleBC 아미노산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 아미노산 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되거나, 또는 이러한 아미노산 서열로 구성된다. 가령, 분리된 핵산은 제 1 폴리펩티드, 제 2 폴리펩티드, 제 3 폴리펩티드와 제 4 폴리펩티드를 인코딩할 수 있는데, 여기서 제 1, 제 2, 제 3 폴리펩티드와 제 4 폴리펩티드는 각각, (a) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487; (b) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 동족체; (c) 하나 이상의 보존된 아미노산 치환을 포함하는, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487의 보존성 변이체; 그리고 (d) SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열로 구성된 군에서 선택되는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로포함하는, 필수적으로 이러한 아미노산 서열로성된다.
분리된 핵산은 대략 1500개 아미노산 잔기, 대략 1400개 아미노산 잔기, 대략 1300개 아미노산 잔기, 대략 1200개 아미노산 잔기, 대략 1100개 아미노산 잔기, 대략 1000개 아미노산 잔기, 대략 900개 아미노산 잔기, 대략 800개 아미노산 잔기, 대략 700개 아미노산 잔기, 대략 600개 아미노산 잔기, 대략 500개 아미노산 잔기, 대략 400개 아미노산 잔기, 또는 대략 300개 아미노산 잔기를 보유하는 폴리펩티드를 인코딩할 수 있다. 바람직한 구체예에서, 분리된 핵산은 대략 1500개 이하(가령, 대략 1500개 이하, 1400개 이하, 1300개 이하, 1200개 이하, 1100개 이하, 1000개 이하, 900개 이하, 800개 이하, 700개 이하, 600개 이하, 500개 이하, 400개 이하, 300개 이하, 또는 200개 이하) 아미노산 잔기를 보유하는 폴리펩티드를 인코딩한다.
분리된 핵산은 적어도 대략 100개 아미노산 잔기를 보유하는 폴리펩티드를 인코딩할 수 있다. 가령, 분리된 핵산은 적어도 대략 200개 아미노산 잔기, 적어도 대략 250개 아미노산 잔기, 또는 적어도 대략 300개 아미노산 잔기를 보유하는 폴리펩티드를 인코딩할 수 있다. 대안으로, 분리된 핵산은 100개 이상(가령, 100개 이상, 150개 이상, 200개 이상, 또는 250개 이상) 아미노산 잔기를 보유하는 폴리펩티드를 인코딩할 수 있다. 분리된 핵산은 대략 200개 아미노산 잔기 내지 대략 1500개 아미노산 잔기, 대략 300개 아미노산 잔기 내지 대략 1000개 아미노산 잔기, 대략 500개 아미노산 잔기 내지 대략 800개 아미노산 잔기, 또는 대략 600개 아미노산 잔기 내지 대략 1000개 아미노산 잔기를 보유하는 폴리펩티드를 인코딩할 수 있다.
분리된 핵산은 세균, 식물, 곤충, 효모, 진균, 또는 동물(가령, 포유동물)로부터 분리될 수 있다. 핵산이 세균으로부터 분리될 때, 상기 세균은 임의의 세균 속(genus)일 수 있다. 가령, 세균은 아내로믹소박터(Anaeromyxobacter), 아스로박터(Arthrobacter), 브델로비브리오(Bdellovibrio), 블라스토피렐룰라(Blastopirellula), 브레비박테리움(Brevibacterium), 버크홀데리아(Burkholderia), 칸디다투스(Candidatus), 클로로플렉서스(Chloroflexus), 클라비박터(Clavibacter), 클로스트리디움(Clostridium), 콜웰리아(Colwellia), 콘그레기박터(Congregibacter), 디설파티바실륨(Desulfatibacillum), 디설포코커스(Desulfococcus), 디설포탈레아(Desulfotalea), 디설푸로모나스(Desulfuromonas), 플라보박테리알레스(Flavobacteriales), 젬마타(Gemmata), 지오박터(Geobacter), 하헬라(Hahella), 잔나스치아(Jannaschia), 키네오코커스(Kineococcus), 렌티스페라(Lentisphaera), 마리카울리스(Maricaulis), 마리노박터(Marinobacter), 미크로코커스(Micrococcus), 미크로스킬라(Microscilla), 모리텔라(Moritella), 미코박테리움(Mycobacterium), 나이세리아(Neisseria), 노카르디아(Nocardia), 오피투타세아(Opitutaceae), 오피투투스(Opitutus), 패니바실루스(Paenibacillus), 펠로박터(Pelobacter), 포토박테리움(Photobacterium), 포토랍두스(Photorhabdus), 플랑크토미케스(Planctomyces), 플레시오시스티스(Plesiocystis), 슈도알테로모나스(Pseudoalteromonas), 사이크로모나스(Psychromonas), 랄스토니아(Ralstonia), 로도코커스(Rhodococcus), 로도피렐룰라(Rhodopirellula), 로세오바리우스(Roseovarius), 쉬와넬라(Shewanella), 스테노트로포모나스(Stenotrophomonas), 스트렙토미세스(Streptomyces), 크산토모나스(Xanthomonas)와 크실렐라(Xylella)로 구성된 군에서 선택되는 속(genus)의 세균일 수 있다.
더욱 구체적으로, 핵산은 아내로믹소박터(Anaeromyxobacter), 아스로박터 아우레스켄스(Arthrobacter aurescens), 아스로박터 클로로페놀리쿠스(Arthrobacter chlorophenolicus), 아스로박터 종(Arthrobacter sp .) FB24, 브델로비브리오 박테리오보루스(Bdellovibrio bacteriovorus), 블라스토피렐룰라 마리나(Blastopirellula marina), 브레위박테리움 리넨스(Brevibacterium linens), 버크홀데리아 암비파리아(Burkholderia ambifaria), 버크홀데리아 세노세파시아(Burkholderia cenocepacia), 버크홀데리아 오클라호멘시스(Burkholderia oklahomensis), 멜리오이도시스균(Burkholderia pseudomallei), 버크홀데리아 종(Burkholderia sp .) 383, 칸디다투스 쿠에네니아 스튜가르티엔시스(Candidatus Kuenenia stuttgartiensis), 클로로플렉서스 아그레간스(Chloroflexus aggregans), 클로로플렉서스 아우란티아쿠스(Chloroflexus aurantiacus), 클라비박터 미시가넨시스 아종 미시가넨시스(Clavibacter michiganensis subsp. michiganensis), 클라비박터 미시가넨시스 아종 세페도니쿠스(Clavibacter michiganensis subsp. Sepedonicus), 클로스트리듐 보틀리눔(Clostridium botulinum), 콜웰리아 사이크레리트래아(Colwellia psychrerythraea), 콘그레기박터 리토랄리스(Congregibacter litoralis), 디설파티바실륨 알케니보란스(Desulfatibacillum alkenivorans), 디설포코커스 올레오보란스(Desulfococcus oleovorans), 디설포탈레아 사이크로필라(Desulfotalea psychrophila), 디설푸로모나스 아세톡시단스(Desulfuromonas acetoxidans), 플라보박테리알레스 박테리움(Flavobacteriales bacterium), 젬마타 옵스쿠리글로버스(Gemmata obscuriglobus), 지오박터 베미드지엔시스(Geobacter bemidjiensis), 지오박터 로블레이(Geobacter lovleyi), 지오박터 종(Geobacter sp.) FRC-32, 지오박터 우라늄레두센스(Geobacter uraniumreducens), 하헬라 제주엔시스(Hahella chejuensis), 잔나스치아 종(Jannaschia sp .) CCS1, 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 렌티스패라 아라네오사(Lentisphaera araneosa), 마리카울리스 마리스(Maricaulis maris), 마리노박터 알기콜라(Marinobacter algicola), 마리노박터 아쿠애올레이(Marinobacter aquaeolei), 미크로코커스 루테우스(Micrococcus luteus), 미크로스킬라 마리나(Microscilla marina), 모리텔라 종(Moritella sp .) PE36, 미코박테리움 아비움(Mycobacterium avium), 미코박테리움 마리눔(Mycobacterium marinum), 미코박테리움 종(Mycobacterium sp .) GP1, 결핵균(Mycobacterium tuberculosis), 미코박테리움 반바알레니(Mycobacterium vanbaalenii), 임질균(Neisseria gonorrhoeae), 노카르디아 파르시니카(Nocardia farcinica), 오피투타세아 박테리움(Opitutaceae bacterium), 오피투투스 테르라(Opitutus terrae), 패니바실루스 종(Paenibacillus sp.) JDR-2, 펠로박터 프로피오니쿠스(Pelobacter propionicus), 포토박테리움 프로푼둠(Photobacterium profundum), 포토박테리움 프로푼둠(Photobacterium profundum), 포토랍두스 루미네센스(Photorhabdus luminescens), 플랑크토미세스 마리스(Planctomyces maris), 플레시오시스티스 파시피카(Plesiocystis pacifica), 슈도알테로모나스 아틀란티카(Pseudoalteromonas atlantica), 사이크로모나스 인그라하밀(Psychromonas ingrahamii), 사이크로모나스 종(Psychromonas sp .) CNPT3, 랄스토니아 피케티(Ralstonia pickettii), 로도코커스 로도크로스(Rhodococcus rhodochrous), 로도코커스 종(Rhodococcus sp .), 로도피렐룰라 발티카(Rhodopirellula baltica), 로세오바리우스 누빈히벤스(Roseovarius nubinhibens) ISM, 쉬와넬라 아마조넨시스(Shewanella amazonensis) SB2B, 쉬와넬라 발티카(Shewanella baltica) OS155, 쉬와넬라 발티카(Shewanella baltica), 쉬와넬라 벤티카(Shewanella benthica), 쉬와넬라 데니트리피칸스(Shewanella denitrificans), 쉬와넬라 프리기디마리나(Shewanella frigidimarina), 쉬와넬라 할리팍센시스(Shewanella halifaxensis), 쉬와넬라 로이히카(Shewanella loihica), 쉬와넬라 오네이덴시스(Shewanella oneidensis), 쉬와넬라 페알레아나(Shewanella pealeana), 쉬와넬라 푸트레파시엔스(Shewanella putrefaciens), 쉬와넬라 세디미니스(Shewanella sediminis), 쉬와넬라 종(Shewanella sp .) ANA-3, 쉬와넬라 종(Shewanella sp .) MR-4, 쉬와넬라 종(Shewanella sp .) MR-7, 쉬와넬라 종(Shewanella sp .) W3-18-1, 쉬와넬라 우디이(Shewanella woodyi), 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 스트렙토미세스 암보파시엔스(Streptomyces ambofaciens), 크산토모나스 악소노포디스(Xanthomonas axonopodis), 크산토모나스 캄페스트리스(Xanthomonas campestris), 크산토모나스 오리재(Xanthomonas oryzae)와 크실렐라 파스티디오사(Xylella fastidiosa)로 구성된 군에서 선택되는 임의의 세균으로부터 분리될 수 있다. 바람직한 구체예에서, 핵산은 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia)(가령, 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) ATCC 17679, 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) ATCC 17674, 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) ATCC 17445, 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) ATCC 17666, 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) K279a, 또는 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) R551-3)의 균주로부터 분리된다.
게놈 서열이 관심 있는 특정 종에서 가용하지 않으면, 관련된 서열이 표준 PCR 방법을 이용하여 게놈 DNA로부터 증폭될 수 있다. 간단히 말하면, 게놈 DNA는 널리 공지된 다양한 방법 중에서 한 가지에 의해 관심 세포로부터 추출된다. Sambrook et al.,(상기)과 Ausubel et al., Current Protocols in Molecular Biology, Greene Publ. Assoc. & Wiley-Intersciences (1989)에서는 DNA 분리를 위한 방법에 관한 설명을 제공한다. 일반적으로, 임의의 생물체가 이런 DNA의 공급원으로서 이용될 수 있다. 추출된 DNA는 이후, 중합효소 연쇄 반응(polymerase chain reaction)을 수행하기 위한 주형(template)으로서 이용된다. PCR을 위하여 축중 프라이머(degenerative primer)가 이용될 수도 있다. PCR을 위한 방법과 조건은 예로써, PCR Protocols, A Guide to Methods and Applications, Innis et al. (eds.), Academic Press, Inc., San Diego, California, 1990에서 기술된다.
증폭 프라이머(amplification primer)는 증폭되는 특정 유전자에 따라 선택될 것이다. 이용되는 프라이머의 구체적인 실례는 하기 표 14에 열거된다. 하지만, 이들 프라이머는 예시일 뿐이다. 당업자는 oleA, oleB, oleC, oleBC와 oleD 핵산 서열로부터 다수의 상이한 프라이머가 유래될 수 있음을 인식할 것이다. 상이한 길이와 조성의 프라이머와 앰플리콘(amplicon)을 수용하기 위하여 증폭 조건에서 변화가 요구될 수 있다. 이런 고려는 당분야에 널리 공지되어 있고, 예로써 PCR Protocols, A Guide to Methods and Applications, Innis et al. (eds.), Academic Press, Inc., San Diego, California, 1990에서 논의된다.
이들 증폭 절차에 의해 획득된 PCR 산물의 염기서열분석(sequencing)은 증폭된 서열의 확증을 용이하게 하고 상이한 종에서 상기 서열의 자연 변이(natural variation)에 관한 정보를 제공하는데 이용될 수 있다. 개시된 OleA, OleB, OleC, OleBC와 OleD 서열로부터 유래된 올리고뉴클레오티드는 이런 염기서열분석 방법에 이용될 수 있다. 밀접하게 관련된 오쏘로거스(orthologous) OleA, OleB, OleC, OleBC와 OleD 서열은 개시된 OleA, OleB, OleC, OleBC와 OleD 서열에 적어도 대략 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 99.5% 서열 동일성을 공유할 수 있다(예로써, 표 1과 2 참조).
바람직한 구체예에서, 핵산은 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23과 SEQ ID NO: 87로 구성된 군에서 선택된다.
본 발명에서는 또한, Ole 단백질, Ole 단백질의 동족체, Ole 단백질의 보존성 변이체 및/또는 Ole 단백질에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 서열을 인코딩하는 하나 이상의 분리된 핵산을 내포하는 재조합 핵산 구조체가 개시된다. 전형적인 재조합 핵산 구조체(construct)에는 클로닝 벡터(cloning vector), 발현 벡터(expression vector), 또는 합성 오페론(synthetic operon)이 포함된다.
본 명세서에서, “벡터”는 그 자신에 연결된 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 유용한 벡터의 한 가지 유형은 에피솜(episome)[즉, 염색체외 복제(extra-chromosomal replication)가 가능한 핵산]이다. 유용한 벡터는 자기 복제(autonomous replication) 및/또는 그들에 연결된 핵산의 발현을 가능하게 하는 벡터이다. 그들에게 작동가능하게 연결된 유전자의 발현을 관리할 수 있는 벡터는 본 명세서에서, “발현 벡터”로 지칭된다. 일반적으로, 재조합 DNA 기술에 유용한 발현 벡터는 종종, “플라스미드(plasmid)” 형태인데, 상기 용어는 벡터 형태에서 염색체에 결합되지 않는 환형 이중 가닥(circular double stranded) DNA 루프(loop)를 지칭한다. 본 명세서에서, “플라스미드”와 “벡터”는 동의어로서 이용되는데, 그 이유는 플라스미드가 가장 일반적으로 이용되는 형태의 벡터이기 때문이다. 하지만, 등가의 기능을 수행하고 추후에 당분야에 공지될 다른 형태의 발현 벡터 역시 포함된다.
클로닝 벡터와 발현 벡터 둘 모두 이들 벡터가 하나 이상의 적합한 재조합 생물체 내에서 복제할 수 있도록 하는 뉴클레오티드 서열을 내포한다. 클로닝 벡터에서, 이러한 서열은 일반적으로, 상기 벡터가 재조합 생물체 염색체와 독립적으로 복제할 수 있도록 하고, 복제 기점(origins of replication) 또는 자기 복제 서열(autonomously replicating sequence) 역시 내포한다. 다양한 세균과 바이러스 복제 기점은 널리 공지되어 있는데, 여기에는 pBR322 유래된 ColE1 레플리콘(replicon), P15A 레플리콘, pCloDF13 레플리콘, pKN402 레플리콘, pMB1(pUC) 레플리콘, pSC1O1 레플리콘, 그리고 SV40, 폴리오마 바이러스(polyoma), 아데노바이러스(adenovirus), VSV와 BPV 바이러스 기원이 포함되지만 이들에 국한되지 않는다.
본 발명에 개시된 핵산은 분리된 핵산을 포함하는 재조합 발현 벡터의 이용에 의해 단백질을 생산하는데 이용될 수 있다. 다양한 발현 벡터가 이용될 수 있다. 가령, 세균 플라스미드, 살균 바이러스(bacteriophage), 효모 에피솜, 효모 염색체 요소(chromosomal element), 바이러스, 이를테면, 배큘로바이러스(baculovirus), 파포바이러스(papovirus), 이를테면 SV40, 우두 바이러스(vaccinia viruse), 아데노바이러스(adenovirus), 계두 바이러스(fowl pox virus), 슈도레이비스 바이러스(pseudorabies virus)와 레트로바이러스(retrovirus)로부터 유래된 벡터, 그리고 이들의 조합으로부터 유래된 벡터, 이를테면, 플라스미드와 살균 바이러스 유전자 요소, 이를테면, 코스미드(cosmid)와 파게미드(phagemid)로부터 유래된 벡터를 비롯한 플라스미드, 염색체, 에피솜과 바이러스-유래된 벡터.
일반적으로, 재조합 생물체 내에서 폴리펩티드를 발현하기 위하여 폴리뉴클레오티드를 유지, 증식, 또는 발현하는데 적합한 임의의 벡터가 이와 관련하여 발현에 이용될 수 있다. 이런 이유로, 재조합 생물체 내에서 복제가능하고 생존하는 임의의 다른 벡터가 이용될 수 있다. 세균 발현 벡터의 무제한적 실례에는 pKK223-3과 pTrc 99A(이들은 trp-lac 프로모터를 내포한다); pUC, pTZ, pSK와 pGEM(이들은 lac 프로모터를 내포한다); pET 벡터와 이의 유도체(이들은 T7 프로모터를 내포한다); 그리고 pHUB 시리즈의 벡터, pPLc 시리즈의 벡터, pKC30, pAS1, pRM1/pRM9와 pTrxFus(이들 모두 살균 바이러스 λpL 프로모터를 내포한다)가 포함된다. 추가의 전형적인 벡터에는 pATH 시리즈의 벡터, pBAD 시리즈의 벡터, pBEc 시리즈의 벡터, pCAL 시리즈의 벡터, pCRT7 시리즈의 벡터, pGAL, pGEX와 유도체, pLEX 시리즈의 벡터, pMAL 시리즈의 벡터, pOSEX 시리즈의 벡터, pQE 시리즈의 벡터, pRSET 시리즈의 벡터, 그리고 pTriEx 시리즈의 벡터가 포함된다. 사카로미세스 세레비시아(S. cerevisiae)에서 핵산의 발현에 적합한 벡터에는 예로써, pAD-GAL4와 이의 유도체, pBridge, pCM과 이의 유도체, pEMBLY 시리즈의 벡터, pESC와 이의 유도체, pFL 시리즈의 벡터, pSZ62, pYC2와 pYC6 시리즈의 벡터, 그리고 YIP 시리즈의 플라스미드가 포함된다.
적절한 핵산 서열은 널리-공지된 다양한 통상의 기술에 의해 벡터 내로 삽입된다. 일반적으로, 발현을 위한 핵산 서열은 하나 이상의 제한 엔도뉴클레아제(restriction endonuclease)로 핵산 서열과 발현 벡터를 절단하고, 이후 T4-DNA 리가아제를 이용하여 이들 제한 단편을 서로 연결함으로써 발현 벡터에 연결된다. 제한과 결찰을 위한 절차는 당분야에 널리 공지되어 있다. 이와 관련하여, 그리고 당분야에 널리 공지된 대안 기술을 이용하여 발현 벡터를 제조하는데 적합한 절차는 Sambrook et al.,(상기)에서 더욱 상세하게 기술된다. 이들 대안 기술의 무제한적 실례에는 예로써, 재조합효소(recombinase) 또는 위상이성질화효소(topoisomerase)에 의한 핵산 서열의 통합이 포함된다.
핵산 서열은 전통적인 기술, 예를 들면, SOE PCR, DNA 합성, 평활 말단(blunt end) 결찰, 또는 제한 효소 부위에서 결찰에 의해 변경되거나, 또는 서로 연결될 수 있다. 적절한 제한 부위가 가용하지 않으면, 합성 올리고뉴클레오티드 어댑터(adapter) 또는 링커(linker)가 이용될 수 있다(예로써, Sambrook et al., 상기; Ausubel et al., 상기 참조).
당업자가 인식하는 바와 같이, 다수의 프로모터가 세포에서 기능성이고 기존 문헌에서 기술되었는데, 여기에는 구조성 프로모터(constitutive promoter), 유도성(inducible promoter), 발달 조절된 프로모터(developmentally regulated promoter), 그리고 환경 조절된 프로모터(environmentally regulated promoter)가 포함된다. 특히, 적절한 재조합 생물체에서 기능성인 프로모터(전사 개시 영역(transcriptional initiation region)으로 지칭됨)의 이용이 주목된다. 가령, 대장균(E. coli)이 재조합 생물체로서 이용되는 경우에, 이용될 수 있는 전형적인 프로모터에는 파지 람다(phage lambda) PL 프로모터, 대장균(E. coli) lac, trp, trc와 tac 프로모터, SV40 초기와 후기 프로모터, 레트로바이러스 LTR의 프로모터, 그리고 CaMV 35S 프로모터가 포함되지만 이들에 국한되지 않는다. 사카로미세스 세레비시아(Saccharomyces cerevisiae)가 숙주이면, 관심 서열은 전형적으로, 효모 프로모터의 제어 하에 놓여진다. 유용한 효모 프로모터의 무제한적 실례에는 GAL/CYC 프로모터가 포함된다.
본 명세서에서 언급되지 않은 당업자에게 공지된 임의의 적절한 프로모터가 본 명세서에 기술된 발명에 용이하게 이용될 수 있다. 가령, 원핵 또는 진핵 세포에서 유전자의 발현을 제어하는 것으로 공지된 다른 프로모터가 이용될 수 있다. 발현 벡터는 또한, 번역(translation) 시작을 위한 리보솜 결합 부위(ribosome binding site)와 전사 종결 부위(transcription termination site)를 내포할 수 있다. 벡터는 또한, 유전자 발현의 증폭에 유용한 서열을 내포할 수 있다.
본 발명에서는 상기 폴리펩티드를 인코딩하는 핵산에 작동가능하게 연결된 프로모터를 포함하는 분리된 핵산을 제시한다. 바람직하게는, 프로모터는 유도성 프로모터, 구조성 프로모터, 또는 세포-특이적 프로모터이다. 바람직한 구체예에서, 프로모터는 T7 프로모터이다. 다른 바람직한 구체예에서, 프로모터는 pTrc 프로모터, PxylA 프로모터, Pgrac 프로모터, GAL1 프로모터, 또는 GAL1O 프로모터이다.
본 명세서에서, “작동가능하게 연결된”은 프로모터가 선별된 DNA의 발현을 조절할 수 있도록, 상기 선별된 뉴클레오티드 서열(가령, 본 발명에 개시된 폴리펩티드를 인코딩)이 상기 프로모터에 근접 위치한다는 것을 의미한다. 이에 더하여, 프로모터는 전사와 번역의 방향의 측면에서, 선별된 뉴클레오티드 서열의 상류에 배치된다. “작동가능하게 연결된”은 적절한 분자[가령, 전사 활성인자 단백질(transcriptional activator protein)]가 조절 서열에 결합될 때 유전자 발현을 가능하게 하는 방식으로 뉴클레오티드 서열과 조절 서열이 연결됨을 의미한다.
게다가, 발현 구조체 내에 조절 전사체 종결 영역이 제공될 수 있다. 전사체 종결 영역은 이용되는 전사체 시작 영역과 자연적으로 연관되는 Ole 단백질 서열 또는 전사 종결 영역을 인코딩하는 벡터 서열에 의해 제공될 수 있다. 재조합 생물체에서 전사를 종결시킬 수 있는 임의의 편의한 전사 종결 영역이 본 발명에 개시된 구조체에 이용될 수 있다. 발현 벡터와 클로닝벡터는 형질전환체(transformant) 세포의 선별을 제공하기 위하여 재조합 생물체에서 발현에 필요한 조절 영역을 보유하는 구조적 유전자 또는 선별 마커를 내포할 수 있고, 그리고 통상적으로 내포한다. 이러한 유전자는 세포독성제(cytotoxic agent)(가령, 항생제, 중금속, 또는 독소)에 대한 내성, 영양요구성 숙주(auxotrophic host)에 원영양성(prototrophy)을 제공하는 상보(complementation), 바이러스 면역(virus immunity) 등을 제공할 수 있다. 발현 구조체 또는 이의 성분이 도입되는 상이한 숙주 종의 숫자에 따라서, 하나 이상의 마커가 이용될 수 있는데, 여기서 선별을 위한 상이한 조건이 상이한 숙주에 이용된다.
적절한 선별 마커의 특정한 비제한적 실례에는 블레오마이신(bleomycin), 에리트로마이신(erythromycin), 젠타마이신(gentamycin), 글리포세이트(glyphosate), 하이그로마이신(hygromycin), 카나마이신(kanamycin), 메토트렉세이트(methotrexate), 날리딕스산(nalidixic acid), 플레오마이신(phleomycin), 포스피노트리신(phosphinotricin), 스펙티노마이신(spectinomycin), 스트렙토마이신(streptomycin), 설폰아미드(sulfonamide), 설포닐우레아(sulfonylureas), 암피실린/카베니실린(ampicillin/carbenicillin), 클로람페니콜(chloramphenicol), 스트렙토마이신/스펙티노마이신(streptomycin/spectinomycin), 또는 테트라사이클린(tetracycline)에 내성을 공여하는 유전자가 포함된다. 적절한 선별 마커(selection marker)의 다른 실례는 영양요구성 선별가능 마커 유전자(auxotrophic selectable marker gene), 예를 들면, 히스티딘 선별가능 마커 유전자이다. 마커의 특정한 비제한적 실례에는 알칼리성 포스파타아제(alkaline phosphatase, AP), myc, 헤마글루티닌(hemagglutinin, HA), 13 글루쿠론산분해효소(glucuronidase, GUS), 루시페라아제(luciferase), 그리고 녹색 형광 단백질(green fluorescent protein, GFP)이 포함된다. 바람직하게는, 분리된 핵산은 상기 폴리펩티드를 인코딩하는 핵산에 결합된 선별 마커를 더욱 포함한다. 선별 마커는 암피실린/카베니실린 내성, 카나마이신 내성, 클로람페니콜 내성, 에리트로마이신 내성, 스트렙토마이신/스펙티노마이신 내성, 또는 히스티딘 영양요구성 선별가능 마커 유전자일 수 있다.
이에 더하여, 발현 벡터는 또한, 마커로서 이용되는 부가적 단백질을 인코딩하는 단백질에 대한 뉴클레오티드 서열에 작동가능하게 연결된 마커 서열을 내포할 수 있다. 이의 결과는 2개의 연결된 상이한 단백질을 포함하는 하이브리드(hybrid) 또는 융합 단백질(fusion protein)이다. 마커 단백질은 예로써, 발현 벡터에 의해 생산된 재조합 단백질에 대한 면역 마커 또는 효소 마커를 제공할 수 있다. 부가적으로, 폴리뉴클레오티드의 말단은 생산된 단백질의 정제에 유용한 아미노산 서열을 인코딩하는 서열의 부가에 의해 변경될 수 있다. 가령, 특정 크로마토그래피 방법에 친화성(affinity)을 부여하는 아미노산 서열을 인코딩하는 DNA 서열이 포함될 수 있다. 단백질에 이런 친화성 정제 모이어티(affinity purification moiety)의 부가를 위한 다양한 방법이 고안되었다. 대표적인 실례는 U.S. Patent No. 4,703,004, 4,782,137, 4,845,341, 5,935,824와 5,594,115호에서 찾아볼 수 있다. 정제 모이어티를 인코딩하는 뉴클레오티드 서열의 부가를 위하여 당분야에 공지된 임의의 방법이 이용될 수 있다(예로써, Sambrook et al., 상기 참조).
특히, 본 발명에서는 Ole 단백질, 또는 이의 변이체와 동족체를 인코딩하는 하나 이상의 분리된 핵산을 포함하는 재조합 구조체를 제시한다. 이들 구조체는 상기 서열이 정방향 또는 역방향으로 삽입된 벡터, 예를 들면, 플라스미드 또는 바이러스 벡터를 내포할 수 있다. 재조합 구조체는 예로써, 상기 서열에 작동가능하게 연결된 프로모터를 비롯한 조절 서열을 더욱 포함할 수 있다. 다수의 적절한 벡터와 프로모터는 공지되어 있고 상업적으로 가용하다. 한 구체예에서, pET-21b(+), pCOLADuet-1, pCDFDuet-1, pcDNA3.1(+), pCMV SPORT6.1(Invitrogen) 벡터, 또는 본 명세서에 기술된 임의의 벡터가 이용된다. 하지만, 숙주 내에서 복제가능하고 생존하는 조건에서, 임의의 적절한 플라스미드 또는 벡터가 이용될 수 있다.
본 발명에서는 분리된 핵산을 포함하는 벡터를 제시한다. 가령, 벡터는 플라스미드일 수 있다. 바람직하게는, 벡터는 pET21b(+), pCOLADuet-1, pCDFDuet-1, pACYCDuet-1, pACYCpTrc, pCL1920pTrc, pESC-HIS, pSUP104, pMM1522, pWH1520, 그리고 pHT01에서 선택되는 플라스미드이다. 바람직한 구체예에서, 벡터는 pET21b(+), pCOLADuet-1, pCDFDuet-1, pWH1520, pHT01, pESC-HIS, pET-21d(+), pETDuet-1, pACYCDuet-1, pTrcHis2A, pMAL-c2X, 또는 pCL1920pTrc에서 선택되는 플라스미드이다.
생존 생물체의 염색체 내로 OleA(가령, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487), OleB(가령, SEQ ID NO: 10과 SEQ ID NO: 230-326), OleC(가령, SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20, SEQ ID NO: 88과 SEQ ID NO: 327-402), OleD(가령, SEQ ID NO: 8, SEQ ID NO: 16, SEQ ID NO: 22, SEQ ID NO: 142-149와 SEQ ID NO: 403-464), OleBC(가령, SEQ ID NO: 135-141) 및/또는 이들 서열의 변이체와 동족체를 인코딩하는 개별 핵산의 통합을 구현하는 재조합 DNA 기술은 개별 단백질의 발현과 생산을 달성할 수 있다.
또한, 분리된 핵산은 최소한, 프로모터, OleA, OleB, OleC, OleD, 또는 OleBC를 인코딩하는 하나 이상의 분리된 핵산, 그리고 재조합 생물체 내에서 기능하는 전사 종결 신호 서열을 포함하는 발현 카세트(expression cassette)의 일부일 수 있다. 프로모터는 본 명세서에 기술된 임의 유형의 프로모터, 예를 들면, 유도성 프로모터 또는 구조성 프로모터일 수 있다. 발현 카세트는 작동가능하게 연결된 표적화 서열, 또는 생산된 단백질의 수송을 관리할 수 있는 통과 또는 분비 펩티드 코딩 영역을 더욱 포함할 수 있다. 발현 카세트는 또한, 선별가능 마커 및/또는 정제 모이어티를 인코딩하는 핵산 서열을 더욱 포함할 수 있다.
조절 서열, 코딩 서열, 그리고 이들의 조합이 숙주 균주의 게놈 내로 도입되거나, 또는 게놈 내에서 변형될 수 있다. 일부 실례에서, 재조합 생물체의 게놈 서열 내로 원하는 재조합 서열의 통합은 선별가능 마커, 이를테면, 항생제의 이용을 필요로 하지 않는다. 일부 실례에서, 게놈 변형에는 고유 프로모터를 조절에 둔감한 프로모터로 교체함으로써 표적 유전자, 예를 들면, oleA, oleB, oleC, oleBC, 또는 oleD의 제어 서열을 변경하는 것이 포함된다. 이를 달성하기 위한 다수의 접근법이 존재한다. 가령, Valle and Flores, Methods Mol . Biol. 267: 113-122 (2006)에서는 대장균(E. coli) 내에서 염색체 유전자를 과다발현하는 PCR-기초된 방법을 기술한다. 다른 접근법은 Costantino et al., Proc . Nat. Acad . Sci. 100: 15748-15753 (2003)에서 개발된 기술을 이용하여 염색체 내에 직접적으로 특정 돌연변이를 발생시키기 위한 단일-가닥 올리고뉴클레오티드의 이용에 기초한다. 상기 기술은 유전자 재조합(genetic recombination)을 강화시키기 위한 살균 바이러스 람다로부터 베타 단백질의 과다발현의 이용에 기초한다. 이러한 접근법의 이점은 70개 또는 그 이상의 염기 길이를 갖는 합성 올리고뉴클레오티드가 점 돌연변이(point mutation), 삽입, 그리고 결실을 산출하는데 이용될 수 있다는 점이다. 상기 방법은 클로닝 단계를 배제한다. 더 나아가, 상기 시스템은 원하는 돌연변이를 분리하기 위한 마커가 필요 없을 정도로 효율적이다. 이러한 접근법은 특히, 내인성(endogenous) 코딩 서열, 예를 들면, OleA, OleB, OleC, OleD, OleBC, 또는 지방산 생합성 경로 효소(fatty acid biosynthetic pathway enzyme)를 인코딩하는 서열을 과다발현하는데 유용하다.
본 발명에서는 (a) 상기 폴리펩티드를 인코딩하는 핵산에 작동가능하게 연결된 조절 서열; (b) 상기 폴리펩티드를 인코딩하는 핵산에 작동가능하게 연결된 선별 마커; (c) 상기 폴리펩티드를 인코딩하는 핵산에 작동가능하게 연결된 정제 모이어티; (d) 상기 폴리펩티드를 인코딩하는 핵산에 작동가능하게 연결된 분비 서열; 그리고 (e) 상기 폴리펩티드를 인코딩하는 핵산에 작동가능하게 연결된 표적화 서열로 구성된 군에서 선택되는 적어도 하나의 추가 핵산 서열을 더욱 포함하는 분리된 핵산을 제시한다.
본 발명에서는 또한, 분리된 핵산을 포함하는 세포를 제시한다. 특히, 세포는 분리된 핵산, 또는 분리된 핵산을 포함하는 벡터를 포함할 수 있다. 세포는 당분야에 공지된 임의의 적절한 방법을 이용하여, 분리된 핵산으로 형질전환(transformation)될 수 있다. 대안으로, 세포는 당분야에 공지된 임의의 적절한 방법을 이용하여, 벡터로 형질감염(transfection)될 수 있다.
본 명세서에서, “형질감염”은 핵산-매개된 유전자 운반에 의한, 수용자 세포 내로 핵산의 도입(가령, 발현 벡터를 통하여)을 의미한다. 본 명세서에서, “형질전환”은 외인성 DNA 또는 RNA의 세포 흡수의 결과로써 세포의 유전형(genotype)이 변화하는 과정을 지칭한다. 이는 재조합 형태의 RNA 또는 폴리펩티드를 발현하는 형질전환된 세포를 산출한다. 운반된 유전자로부터 안티센스 발현의 경우에, 상기 폴리펩티드의 자연 발생 형태의 발현이 교란된다.
세포는 효모 세포, 진균 세포, 조류 세포, 동물 세포, 곤충 세포, 세균 세포, 또는 식물 세포일 수 있다. 세포는 고세균(Archaea) 세포일 수 있다. 한 구체예에서, 세포는 세균 세포이다.
세포는 에스체르키아(Escherichia), 바실루스(Bacillus), 락토바실루스(Lactobacillus), 로도코커스(Rhodococcus), 슈도모나스(Pseudomonas), 아스페르길루스(Aspergillus), 트리코더마(Trichoderma), 뉴로스포라(Neurospora), 푸사륨(Fusarium), 후미콜라(Humicola), 리조무코르(Rhizomucor), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 무코르(Mucor), 미셀리오프토라(Myceliophtora), 페니실리움(Penicillium), 파네로차에테(Phanerochaete), 플레우로투스(Pleurotus), 트라메테스(Trametes), 크리소스포리움(Chrysosporium), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 스테노트로파모나스(Stenotrophamonas), 키네오코커스(Kineococcus), 야로위아(Yarrowia), 또는 스트렙토미세스(Streptomyces) 속(genus)의 세포로부터 선택될 수 있다. 구체적으로, 세포는 바실루스 렌투스(Bacillus lentus) 세포, 바실루스 브레비스(Bacillus brevis) 세포, 바실루스 스테아로테르모필루스(Bacillus stearothermophilus) 세포, 바실루스 리체니포르미스(Bacillus licheniformis) 세포, 바실루스 알칼로필루스(Bacillus alkalophilus) 세포, 바실루스 코아굴란스(Bacillus coagulans) 세포, 바실루스 키르쿨란스(Bacillus circulans) 세포, 바실루스 푸밀리스(Bacillus pumilis) 세포, 바실루스 투린기엔시스(Bacillus thuringiensis) 세포, 바실루스 클라우시(Bacillus clausii) 세포, 바실루스 메가테리움(Bacillus megaterium) 세포, 바실루스 서브틸리스(Bacillus subtilis) 세포, 또는 바실루스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) 세포일 수 있다. 부가적으로, 세포는 트리코더마 코닌기(Trichoderma koningii) 세포, 트리코더마 비리데(Trichoderma viride) 세포, 트리코더마 레세이(Trichoderma reesei) 세포, 트리코더마 롱지브라치아툼(Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리(Aspergillus awamori) 세포, 아스페르길루스 푸미가테스(Aspergillus fumigates) 세포, 아스페르길루스 포에티두스(Aspergillus foetidus) 세포, 아스페르길루스 니둘란스(Aspergillus nidulans) 세포, 아스페르길루스 니게르(Aspergillus niger) 세포, 아스페르길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 리조무코르 미에헤이(Rhizomucor miehei) 세포, 또는 무코르 미에헤이(Mucor miehei) 세포일 수 있다.
바람직한 구체예에서, 세포는 스트렙토미세스 리비단스(Streptomyces lividans) 세포, 스트렙토미세스 무리누스(Streptomyces murinus) 세포, 방선균(Actinomycetes) 세포, 또는 대장균(Escherichia coli) 세포이다. 대장균(Escherichia coli) 세포는 균주 B, 균주 C, 균주 K, 또는 균주 W 대장균(Escherichia coli) 세포일 수 있다. 세포는 또한, 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) 세포, 키네오코커스 라디오톨레란스(Kineococcus radiotolerans) 세포, 바실루스 메가테리움(Bacillus megaterium) 세포, 또는 사카로미세스 세레비시아(Saccharomyces cerevisiae) 세포일 수도 있다.
더욱 구체적으로, 세포는 아내로믹소박터 종(Anaeromyxobacter sp .) Fw109-5, 아스로박터 아우레스켄스(Arthrobacter aurescens), 아스로박터 클로로페놀리쿠스(Arthrobacter chlorophenolicus), 아스로박터 종(Arthrobacter sp .) FB24, 브델로비브리오 박테리오보루스(Bdellovibrio bacteriovorus), 블라스토피렐룰라 마리나(Blastopirellula marina), 브레위박테리움 리넨스(Brevibacterium linens), 버크홀데리아 암비파리아(Burkholderia ambifaria), 버크홀데리아 세노세파시아(Burkholderia cenocepacia), 버크홀데리아 오클라호멘시스(Burkholderia oklahomensis), 멜리오이도시스균(Burkholderia pseudomallei), 버크홀데리아 종(Burkholderia sp .) 383, 칸디다투스 쿠에네니아 스튜가르티엔시스(Candidatus Kuenenia stuttgartiensis), 클로로플렉서스 아그레간스(Chloroflexus aggregans), 클로로플렉서스 아우란티아쿠스(Chloroflexus aurantiacus), 클라비박터 미시가넨시스 아종 미시가넨시스(Clavibacter michiganensis subsp. michiganensis), 클라비박터 미시가넨시스 아종 세페도니쿠스(Clavibacter michiganensis subsp. Sepedonicus), 클로스트리듐 보틀리눔(Clostridium botulinum), 콜웰리아 사이크레리트래아(Colwellia psychrerythraea), 콘그레기박터 리토랄리스(Congregibacter litoralis), 디설파티바실륨 알케니보란스(Desulfatibacillum alkenivorans), 디설포코커스 올레오보란스(Desulfococcus oleovorans), 디설포탈레아 사이크로필라(Desulfotalea psychrophila), 디설푸로모나스 아세톡시단스(Desulfuromonas acetoxidans), 플라보박테리알레스 박테리움(Flavobacteriales bacterium), 젬마타 옵스쿠리글로버스(Gemmata obscuriglobus), 지오박터 베미드지엔시스(Geobacter bemidjiensis), 지오박터 로블레이(Geobacter lovleyi), 지오박터 종(Geobacter sp.) FRC-32, 지오박터 우라늄레두센스(Geobacter uraniumreducens), 하헬라 제주엔시스(Hahella chejuensis), 잔나스치아 종(Jannaschia sp .) CCS1, 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 렌티스패라 아라네오사(Lentisphaera araneosa), 마리카울리스 마리스(Maricaulis maris), 마리노박터 알기콜라(Marinobacter algicola), 마리노박터 아쿠애올레이(Marinobacter aquaeolei), 미크로코커스 루테우스(Micrococcus luteus), 미크로스킬라 마리나(Microscilla marina), 모리텔라 종(Moritella sp .) PE36, 미코박테리움 아비움(Mycobacterium avium), 미코박테리움 아비움 아종 파라투베르쿨로시스(Mycobacterium avium subsp. paratuberculosis), 미코박테리움 마리눔(Mycobacterium marinum), 미코박테리움 종(Mycobacterium sp .) GP1, 결핵균(Mycobacterium tuberculosis), 미코박테리움 반바알레니(Mycobacterium vanbaalenii), 임질균(Neisseria gonorrhoeae), 노카르디아 파르시니카(Nocardia farcinica), 오피투타세아 박테리움(Opitutaceae bacterium), 오피투투스 테르라(Opitutus terrae), 패니바실루스 종(Paenibacillus sp.) JDR-2, 펠로박터 프로피오니쿠스(Pelobacter propionicus), 포토박테리움 프로푼둠(Photobacterium profundum), 포토박테리움 프로푼둠(Photobacterium profundum), 포토랍두스 루미네센스 아종 라우몬디(Photorhabdus luminescens subsp. laumondii), 플랑크토미세스 마리스(Planctomyces maris), 플레시오시스티스 파시피카(Plesiocystis pacifica), 슈도알테로모나스 아틀란티카(Pseudoalteromonas atlantica), 사이크로모나스 인그라하밀(Psychromonas ingrahamii), 사이크로모나스 종(Psychromonas sp .) CNPT3, 랄스토니아 피케티(Ralstonia pickettii), 로도코커스 로도크로스(Rhodococcus rhodochrous), 로도코커스 종(Rhodococcus sp .), 로도피렐룰라 발티카(Rhodopirellula baltica), 로세오바리우스 누빈히벤스(Roseovarius nubinhibens), 쉬와넬라 아마조넨시스(Shewanella amazonensis), 쉬와넬라 발티카(Shewanella baltica), 쉬와넬라 벤티카(Shewanella benthica), 쉬와넬라 데니트리피칸스(Shewanella denitrificans), 쉬와넬라 프리기디마리나(Shewanella frigidimarina), 쉬와넬라 할리팍센시스(Shewanella halifaxensis), 쉬와넬라 로이히카(Shewanella loihica), 쉬와넬라 오네이덴시스(Shewanella oneidensis), 쉬와넬라 페알레아나(Shewanella pealeana), 쉬와넬라 푸트레파시엔스(Shewanella putrefaciens), 쉬와넬라 세디미니스(Shewanella sediminis), 쉬와넬라 종(Shewanella sp .) ANA-3, 쉬와넬라 종(Shewanella sp .) MR-4, 쉬와넬라 종(Shewanella sp .) MR-7, 쉬와넬라 종(Shewanella sp .) W3-18-1, 쉬와넬라 우디이(Shewanella woodyi), 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 스트렙토미세스 암보파시엔스(Streptomyces ambofaciens), 크산토모나스 악소노포디스(Xanthomonas axonopodis), 크산토모나스 캄페스트리스(Xanthomonas campestris), 크산토모나스 오리재(Xanthomonas oryzae)와 크실렐라 파스티디오사(Xylella fastidiosa)의 균주일 수 있다.
선택적으로, 세포는 동물 세포일 수 있다. 가령, 동물 세포는 CHO 세포, COS 세포, VERO 세포, BHK 세포, HeLa 세포, Cv1 세포, MDCK 세포, 293 세포, 3T3 세포와 PC12 세포로 구성된 군에서 선택될 수 있다.
본 발명에서는 또한, 지방산 생합성 경로(fatty acid biosynthetic pathway)에 관여하는 유전자에서 변경(alteration)을 포함하는 세포를 제시한다. 본 명세서에서, “지방산 생합성 경로”는 지방산을 생산하는 생합성 경로를 의미한다. 이러한 지방산 생합성 경로는 지방산을 생산하기 위하여 본 명세서에 기술된 바와 같이 조작될 수 있고, 일부 구체예에서 원하는 탄소 사슬 특징을 갖는 지방산을 생산하기 위하여 부가적 효소와 함께 발현될 수 있는 지방산 효소를 포함한다.
본 명세서에서, “지방산 효소”는 지방산 생합성에 관여하는 임의의 효소를 의미한다. 지방산 효소는 지방산을 생산하기 위하여 숙주 세포에서 발현 또는 과다발현될 수 있다. 지방산 효소의 비제한적 실례에는 지방산 신타아제와 티오에스테라아제가 포함된다.
가령, 세포는 아실-Coa 신타아제(EC 6.2.1.3, 2.3.1.86), 티오에스테라아제(EC 3.1.2.-, 3.1.1.15, 3.1.2.14), 아세틸-CoA 카르복실라아제(EC 6.4.1.2, 6.3.4.14), 아실-담체 단백질, 피루베이트 데히드로게나아제(EC 1.2.4.1), 알데히드 데카르보닐라아제(EC 4.1.99.5), 베타-히드록시데카노일 티오에스테르 데히드라타아제(dehydratase)(EC 4.2.1.60), 3-옥소아실-[아실-담체-단백질] 신타아제 I(EC 2.3.1.41), [아실-담체-단백질] S-말로닐트랜스퍼라아제(EC 2.3.1.39), 3-옥소아실-[아실-담체 단백질] 리덕타아제(reductase)(EC 1.1.1.100), 3-옥소아실-[아실-담체-단백질] 신타아제 III(EC 2.3.1.180), 에노일-[아실-담체-단백질] 리덕타아제(EC 1.3.1.9), (3R)-히드록시미리스톨 아실 담체 단백질 데히드라타아제(EC 4.2.1.-), 리파아제(EC 3.1.1.3), 말로닐-CoA 데카르복실라아제(EC 4.1.1.9, 4.1.1.41), 아스파르테이트 1-데카르복실라아제(EC 4.1.1.11), 판토테네이트(pantothenate) 키나아제(EC 2.7.1.33), 피루베이트 데히드로게나아제(EC 1.2.4.1), 피리딘 뉴클레오티드 트랜스히드로게나아제(transhydrogenase)(EC 1.6.1.1), 그리고 이들의 조합을 과다발현할 수 있다.
지방 아실 사슬을 내포하는 기질을 생산하기 위하여 하나 이상의 펩티드를 과다발현하는 것 이외에, 세포는 부가적으로, 하나 이상의 펩티드가 기능적으로 결실되거나, 돌연변이되거나, 또는 약화될 수 있다. 본 명세서에서, “약화”는 약화, 감소 또는 감퇴를 의미한다. 가령, 폴리펩티드는 활성이 감소하도록 상기 폴리펩티드를 변형함으로써(가령, 상기 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 변형함으로써) 약화될 수 있다.
가령, 아래 중에서 하나 이상이 결실되거나, 돌연변이되거나, 또는 약화될 수 있다: 아세테이트 키나아제(EC 2.7.2.1), 알코올 데히드로게나아제(EC 1.1.1.1, 1.2.1.10), 3-옥소아실-[아실-담체-단백질] 신타아제 II(EC 2.3.1.179), FabR 전사 억제자(transcriptional repressor)(기탁 NP_418398), 아실-CoA 데히드로게나아제(EC 1.3.99.3, 1.3.99.-), 생합성 sn-글리세롤 3-포스페이트 데히드로게나아제(EC 1.1.1.94), 락테이트 데히드로게나아제(EC 1.1.1.28), 포르메이트 아세틸트랜스퍼라아제(acetyltransferase)(EC 2.3.1.54), 아실트랜스퍼라아제(acyltransferase)(EC 2.3.1.15), 피루베이트 옥시다아제(oxidase)(EC 1.2.2.2), 그리고 포스포트랜스아세틸라아제(phosphotransacetylase)(EC 2.3.1.8).
일부 실례에서, 세포는 지방 아실 사슬, 탄화수소, 그리고 탄화수소 중간물질을 내포하는 기질을 비롯한 가지형 산물을 생산할 수 있다. 따라서 세포는 분지쇄 케토산(keto acid) 데히드로게나아제 복합체(EC 1.2.4.4), 분지쇄 아미노산 아미노트랜스퍼라아제(aminotransferase)(EC 2.6.1.42), 디히드로리포아미드(dihydrolipoamide) 데히드로게나아제(E3)(EC 1.8.1.4), 크로토닐(crotonyl)-CoA 리덕타아제(EC 1.6.5.5, 1.1.1.1), 이소부티릴(isobutyryl)-CoA 뮤타아제(mutase), 아단위 A(EC 5.4.99.2), 이소부티릴-CoA 뮤타아제, 아단위 B(5.4.99.2), 베타-케토아실-ACP 신타아제 III(EC 2.3.1.180), 베타-케토아실-ACP 신타아제 II(EC 2.3.1.179), 아실-담체 단백질(NP_823468), 에노일-CoA 리덕타아제(EC 1.3.1.34), 에노일-CoA 이소머라아제(isomerase)(EC 4.2.1.-), 그리고 이들의 조합 중에서 하나 이상의 성분에서 선택되는 펩티드를 과다발현함으로써 가지화(branching)가 증가하도록 조작될 수 있다.
지방 아실 사슬, 탄화수소, 그리고 탄화수소 중간물질을 내포하는 기질의 포화 수준은 3-옥소아실-[아실-담체-단백질] 신타아제 I(EC 2.3.1.41), 트랜스-2-에노일-ACP 리덕타아제 II(EC 1.3.1.9), 에노일-(아실 담체 단백질) 리덕타아제(EC 1.3.1.9), 트랜스-2, cis-3-데세노일-ACP 이소머라아제(4.2.1.17), 아실-CoA 데히드로게나아제(EC 1.3.99.3, 1.3.99.-), 그리고 이들의 조합에서 선택되는 펩티드를 과다발현하도록 세포를 조작함으로써 변경될 수 있다.
탄화수소 또는 탄화수소 중간물질을 생산하도록 세포를 조작하는 것 이외에, 생산되는 탄화수소의 유형을 변화시키기 위하여 환경 조건, 예를 들면, 온도 역시 조절될 수 있다. 가령, 더욱 낮은 온도는 탄화수소에서 더욱 많은 수의 이중 결합을 산출하는데 이용될 수 있고 더욱 높은 온도는 더욱 높은 포화 수준으로 이어질 수 있다. 1962년에, Marr와 Ingraham은 대장균(E. coli)에 의해 생산된 지질에서 온도가 포화도(degree of saturation)에 영향을 준다는 것을 증명하는 논문을 발표하였다[Marr et al., J Bacteriol ., 84: 1260-7 (1962)]. 낮은 온도는 더욱 높은 불포화도를 갖는 지질의 생산을 초래하는 반면, 더욱 높은 온도는 더욱 많은 양의 포화된 지질을 초래한다(예로써, 실시예 14 참조). 이런 이유로, 생산 동안 온도를 낮추면 산물을 변경하여 탄화수소 또는 탄화수소 중간물질에서 더욱 높은 불포화도를 유도할 수 있다.
바람직하게는, 세포는 아실-CoA 데히드로게나아제를 인코딩하는 유전자에서 변경을 포함한다. 이러한 변경은 아실-CoA 데히드로게나아제를 인코딩하는 유전자의 결실, 돌연변이, 또는 약화일 수 있다. 다른 바람직한 구체예에서, 세포는 티오에스테라아제를 인코딩하는 유전자에서 변경을 포함한다. 이러한 변경은 티오에스테라아제를 인코딩하는 유전자의 과다발현일 수 있다.
일부 실례에서, 아실-CoA 신타아제 활성을 갖는 펩티드가 과다발현된다. 가령, 아실-CoA 신타아제, 이를테면, fadD(NP_416319), fadK(NP_416216), fadD(YP_045024), fadD(NP_438551), BH3103(NP_243969), yhfL(NP_388908), Pfl_4354(YP_350082), fadD1(NP_251989), fadD2(NP_251990), fadD(YP_533919), RPC_4074(YP_533919), fadD1(NP_520978), fadD35(NP_217021), fadD22(NP_217464), 그리고 이들의 조합이 발현되거나, 결실되거나, 돌연변이되거나, 또는 약화될 수 있다. 아실-CoA 신타아제의 다른 실례는 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) R551-3(ZP_O1644857.1)로부터의 fadD 동족체이다.
이에 더하여, 지방 아실 사슬을 비롯한 산물의 양 및/또는 산물의 탄소 사슬 길이를 변경하기 위하여 티오에스테라아제 발현이 제어될 수 있다. 가령, 티오에스테라아제, 이를테면, 리더 서열(leader sequence) 없는 tesA(AAC73596), tesB(AAC73555), Uc fatB(Q41635, AAA34215), Ch fatB2(Q39513, AAC49269), Ch fatB3(AAC49269, AAC72881), Cc fatB(Q39473, AAC49151), At fatB[M141T](CAA85388), At fatA(NP 189147, NP 193041), Ch fatA(AAC72883), Ha fatA1(AAL79361), 또는 이들의 조합이 발현되거나, 결실되거나, 돌연변이되거나, 또는 약화될 수 있다.
선택적으로, 세포는 아실-CoA 신타아제 또는 티오에스테라아제를 포함할 수 있다. 가령, 세포는 아실-CoA 신타아제 또는 티오에스테라아제를 인코딩하는 분리된 핵산으로 형질전환될 수 있다. 대안으로, 세포는 아실-CoA 신타아제 또는 티오에스테라아제를 인코딩하는 분리된 핵산을 포함하는 벡터로 형질감염될 수 있다.
재조합 생물체는 정의된 구조적 특징(가령, 가지화 정도, 포화, 또는 탄소 사슬 길이)을 갖는 탄화수소와 지방족 케톤을 생산하기 위하여 본 발명에 개시된 분리된 핵산과 단백질을 이용하여 조작될 수 있다. 탄화수소를 만드는 한 가지 방법은 하나 이상의 아실-축합 효소(하나 이상의 아실-CoA, 아실-ACP, 아실-AMP, 아실-에스테르, 지방산, 또는 이들의 혼합물을 축합하는 효소)의 발현을 증가시키거나, 또는 이들 아실-축합 효소의 더욱 활성 형태를 발현하는 단계를 수반한다. 당업자가 인식하는 바와 같이, 이런 축합 반응으로부터 생산된 산물은 축합되는 아실 사슬에 따라서 변한다. 생산될 수 있는 산물에는 예로써, 탄화수소와 탄화수소 중간물질, 예를 들면, 지방족 케톤이 포함된다.
당업자가 인식하는 바와 같이, 지방 아실 사슬과 이의 중간물질을 내포하는 기질은 화학적 또는 효소적 변환(conversion)을 비롯한 시험관내 반응(in vitro reaction)을 이용하여, 그리고 생체내 반응(in vivo reaction)을 통하여 생산될 수 있다. 부가적으로, 생체내와 시험관내 변환의 조합이 이용될 수 있다. 게다가, 이러한 변환을 위하여 선택된 기질, 이를테면, 지방산, 아실-ACP, 또는 아실-CoA를 선별적으로 제공함으로써 특정 지방족 케톤이 생산될 수 있다. 대안으로, 이러한 변환을 위하여 선택된 기질, 이를테면, 지방산, 아실-ACP, 아실-CoA, 지방족 케톤, α-알킬-β-케토산, 또는 α-알킬-β-케토 에스테르를 선별적으로 제공함으로써 탄화수소가 생산될 수 있다.
본 명세서에서, “지방산”은 화학식 RCOOH를 보유하는 카르복실산을 의미한다. R은 지방족 기, 바람직하게는, 알킬 기를 나타낸다. R은 대략 4개 내지 대략 22개의 탄소 원자를 보유한다. 지방산은 포화, 단일-불포화, 또는 다중-불포화될 수 있다. 바람직한 구체예에서, 지방산은 지방산 생합성 경로로부터 만들어진다.
“변환”이라는 용어는 첫 번째 중간물질 또는 기질을 두 번째 중간물질 또는 산물로 변화시키는 화학적 수단 또는 생물학적 수단(가령, 반응물 내에서 폴리펩티드)의 이용을 지칭한다. “화학적 변환”이라는 용어는 폴리펩티드에 의해 능동적으로 촉진되지 않는 반응을 지칭한다. “생물학적 변환”이라는 용어는 폴리펩티드에 의해 능동적으로 촉진되는 반응을 지칭한다. 변환은 생체내에서, 시험관내에서, 또는 둘 모두에서 진행될 수 있다. 생물학적 변환이 이용될 때, 펩티드 및/또는 세포는 서포트(support)에 고정될 수 있다, 가령, 화학적 부착(chemical attachment)에 의해 중합체 서포트에 고정될 수 있다. 이들 변환은 당업자에게 공지된 임의의 반응기, 예를 들면, 배치(batch) 또는 연속 반응기(continuous reactor)를 이용하여 달성될 수 있다.
재조합 생물체는 여러 중간물질을 후속 중간물질로 변환시킬 수 있거나, 또는 재조합 생물체는 산물로 변환되는 중간물질이 공급되거나, 또는 이러한 중간물질과 접촉 배치될 수 있다. 특정 실례에서, 재조합 생물체는 중간물질, 이를테면, 아실-CoA 분자와 접촉 배치되고, 상기 아실-CoA 분자는 이후, 산물로 변형된다.
본 명세서에 기술된 개시를 고려하면, Ole 단백질(가령, OleA, OleB, OleC, OleD와 OleBC)과 이의 동족체의 대규모 효소 생산이 가능하다. 간단히 말하면, 이들 펩티드 또는 이들 펩티드의 동족체 중에서 임의의 하나로부터 코딩 서열(예로써, 표 1과 2 참조)이 고발현 플라스미드, 이를테면, pET-21b(+), pCOLADuet-1(EMD Chemicals, Inc., Germany), pWH1520(Mo Bi Tec, Germany) 또는 pHT01(Mo Bi Tec, Germany) 내로 클로닝될 수 있다. 상기 플라스미드는 효소의 생산을 위한 숙주 세포 내로 도입될 수 있다. 생성된 펩티드는 이후, 정제되고 배치 생산(batch production)에 이용될 수 있다.
시험관내 방법이 이용될 때, 반응물에 공급되는 펩티드는 출발 물질(starting material)에 좌우될 것이다. 가령, 탄화수소가 요구될 때, 아실-ACP 및/또는 아실-CoA 기질이 OleA, OleC와 OleD를 내포하는 시험관내 반응 혼합물에 첨가될 것이다. 유사하게, 출발 물질이 지방족 케톤, α-알킬-β-케토산, 또는 α-알킬-β-케토 에스테르일 때, 펩티드 OleC와 OleD가 시험관내 반응물에 이용될 수 있다.
첫 번째 펩티드가 첫 번째 중간물질을 두 번째 중간물질로 변환시키는데 이용되고, 이후 두 번째 펩티드가 두 번째 중간물질을 세 번째 중간물질로 변환시키는데 이용될 때, 이들 펩티드는 반응물에 동시에 또는 순차적으로 첨가될 수 있다. 일부 실례에서, 이들 펩티드가 순차적으로 첨가되는 경우에, 첫 번째 펩티드는 두 번째 펩티드의 첨가에 앞서 제거될 수 있다.
부가적으로, 원하는 산물을 생산하기 위하여 화학적 변환과 생물학적 변환의 조합이 이용될 수 있다. 가령, 당업자는 2개의 지방산이 화학적 변환을 통하여 축합되어 지방족 케톤을 형성하고, 생성된 지방족 케톤이 생물학적 변환을 통하여 탄화수소로 변환될 수 있음을 인식할 것이다.
본 명세서에 기술된 개시를 고려하면, 지방족 케톤, 탄화수소, 그리고 이들의 중간물질은 재조합 세포에서 생산될 수 있다. 이러한 재조합 세포는 OleA, OleB, OleC, OleD, OleBC와 이들의 관련된 서열에 의해 인코딩되는 하나 이상의 펩티드를 생산할 수 있다. 당업자가 인식하는 바와 같이, 재조합 세포에서 발현하는 펩티드의 선택은 원하는 산물과 이들 세포에 제공된 출발 물질에 좌우될 것이다. 가령, 재조합 세포에 지방족 케톤이 공급되고 원하는 산물이 탄화수소이면, 상기 재조합 세포는 OleC와 OleD를 인코딩하는 뉴클레오티드 산으로 조작될 수 있다.
본 명세서에 기술된 생체내 방법은 또한, 화학적 변환과 시험관내 생물학적 변환과 공동으로 이용될 수 있다. 가령, 첫 번째 중간물질은 시험관내에서 펩티드를 이용하여 두 번째 중간물질로 변환될 수 있고; 두 번째 중간물질은 이후, 두 번째 중간물질의 세 번째 중간물질로의 변환에 필요한 펩티드를 발현하는 세포에 공급될 수 있다. 다른 실례에서, 첫 번째 중간물질은 화학적 변환을 통하여 두 번째 중간물질로 변환될 수 있고, 이후 두 번째 중간물질은 후속 변환에 필요한 펩티드를 인코딩하는 재조합 세포에 공급될 수 있다.
부가적으로, 산물은 2개 이상의 생체내 반응 단계를 이용하여 생산될 수 있다. 가령, 첫 번째 재조합 세포가 첫 번째 중간물질을 두 번째 중간물질로 변환시키는데 이용될 수 있다. 두 번째 중간물질은 예로써, 수동 수송(passive transport), 능동 수송(active transport), 또는 세포 용해(cell lysis)를 통하여 상기 세포로부터 방출될 수 있고, 이후 두 번째 중간물질은 두 번째 재조합 세포에 공급될 수 있고, 여기서 두 번째 중간물질이 세 번째 중간물질로 변환된다. 일부 실례에서, 세 번째 중간물질이 원하는 산물일 것이다.
본 발명은 정의된 탄소 사슬 길이, 포화 수준과 가지점(branch point)을 보유하는 지방족 케톤, 탄화수소, 그리고 탄화수소 중간물질의 대규모 생산을 가능하게 한다. 이런 조작된 분자의 생산은 연료와 전문 화학제품(specialty chemical)으로서 이용될 수 있는 다양한 산물을 제공한다.
본 발명에서는 본 발명에 개시된 임의의 핵산(가령, 본 발명에 개시된 임의의 폴리펩티드 서열을 인코딩하는 핵산 서열)으로 형질전환되거나, 또는 본 발명에 개시된 임의의 벡터로 형질감염된 세포를 제시한다. 바람직하게는, 이러한 세포는 탄화수소 또는 지방족 케톤을 생산한다. 탄화수소는 올레핀일 수 있다. 한 구체예에서, 탄화수소 또는 지방족 케톤은 상기 세포에 의해 분비된다. 바람직한 구체예에서, 상기 세포는 OleA를 인코딩하는 분리된 핵산을 포함한다. 구체적으로, OleA를 인코딩하는 분리된 핵산을 포함하는 세포는 사카로미세스 세레비시아(Saccharomyces cerevisiae) 세포일 수 있다.
본 발명에서는 탄화수소를 생산하는 방법을 제시하는데, 상기 방법은 탄화수소를 생산하는데 충분한 조건 하에, 본 발명에 개시된 임의의 분리된 핵산(가령, 본 발명에 개시된 임의의 폴리펩티드 서열을 인코딩하는 핵산 서열)을 포함하는 임의의 세포를 기질과 함께 배양하는 단계를 포함한다. 가령, 기질은 탄소 공급원, 지방산, 아실-CoA, 아실-AMP, 아실-ACP, α-알킬-β-케토산, α-알킬-β-케토 에스테르, 또는 지방족 케톤일 수 있다. 바람직하게는, 세포의 생산력(productivity)은 적어도 대략 3 ㎎/ℓ/OD600이다. 가령, 세포의 생산력은 적어도 대략 5 ㎎/ℓ/OD600, 적어도 대략 8 ㎎/ℓ/OD600, 적어도 대략 15 ㎎/ℓ/OD600, 적어도 대략 20 ㎎/ℓ/OD600, 또는 적어도 대략 30 ㎎/ℓ/OD600일 수 있다.
본 발명에서는 또한, 탄화수소를 생산하는 방법을 제시하는데, 상기 방법은 탄화수소를 생산하는데 충분한 조건 하에, 본 발명에 개시된 임의의 분리된 핵산(가령, 본 발명에 개시된 임의의 폴리펩티드 서열을 인코딩하는 핵산 서열)을 포함하는 임의의 세포를 기질과 함께 배양하는 단계를 포함하고, 탄화수소를 분리하는 단계를 더욱 포함한다. 탄화수소는 세포로부터 또는 이러한 세포가 배양되는 배지로부터 분리될 수 있다. 기질은 예로써, 탄소 공급원, 지방산, 아실-CoA, 아실-AMP, 아실-ACP, α-알킬-β-케토산, α-알킬-β-케토 에스테르, 또는 지방족 케톤일 수 있다.
본 발명에서는 탄화수소를 생산하는 방법을 제시하는데, 상기 방법은 탄화수소를 생산하는데 충분한 조건 하에, 본 발명에 개시된 임의의 분리된 핵산(가령, 본 발명에 개시된 임의의 폴리펩티드 서열을 인코딩하는 핵산 서열)을 포함하는 임의의 세포를 기질(가령, 탄소 공급원, 지방산, 아실-CoA, 아실-AMP, 아실-ACP, α-알킬-β-케토산, α-알킬-β-케토 에스테르, 또는 지방족 케톤)과 함께 배양하는 단계를 포함하고, 탄화수소를 크래킹(cracking) 또는 정제(refining)하는 단계를 더욱 포함한다.
상기 방법은 단일불포화 또는 다중불포화(가령, 이중-불포화, 삼중-불포화 등) 탄화수소를 생산할 수 있다. 이러한 탄화수소는 대략 10개 내지 대략 40개 탄소의 탄소 사슬 길이(carbon chain length)를 가질 수 있다. 가령, 이러한 탄화수소는 대략 15개 내지 대략 35개, 대략 17개 내지 대략 34개, 대략 18개 내지 대략 33개, 대략 19개 내지 대략 33개, 대략 27개 내지 대략 33개, 대략 29개 내지 대략 31개, 또는 대략 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 또는 33개 탄소의 탄소 사슬 길이를 가질 수 있다.
본 발명에서는 지방족 케톤을 생산하는 방법을 제시하는데, 상기 방법은 지방족 케톤을 생산하는데 충분한 조건 하에, 본 발명에 개시된 임의의 분리된 핵산(가령, 본 발명에 개시된 임의의 폴리펩티드 서열을 인코딩하는 핵산 서열)을 포함하는 임의의 세포를 기질과 함께 배양하는 단계를 포함한다. 가령, 기질은 탄소 공급원, 지방산, 아실-CoA, 아실-AMP, 아실-ACP, α-알킬-β-케토산, 또는 α-알킬-β-케토 에스테르일 수 있다. 바람직하게는, 세포의 생산력(productivity)은 적어도 대략 0.1 ㎎/ℓ/OD600이다. 가령, 세포의 생산력은 적어도 대략 0.1 ㎎/ℓ/OD600, 적어도 대략 1 ㎎/ℓ/OD600, 적어도 대략 3 ㎎/ℓ/OD600, 적어도 대략 6 ㎎/ℓ/OD600, 적어도 대략 9 ㎎/ℓ/OD600, 또는 적어도 대략 12 ㎎/ℓ/OD600일 수 있다.
본 발명에서는 또한, 지방족 케톤을 생산하는 방법을 제시하는데, 상기 방법은 지방족 케톤을 생산하는데 충분한 조건 하에, 본 발명에 개시된 임의의 분리된 핵산을 포함하는 임의의 세포를 기질과 함께 배양하는 단계를 포함하고, 지방족 케톤을 분리하는 단계를 더욱 포함한다. 지방족 케톤은 세포로부터 또는 이러한 세포가 배양되는 배지로부터 분리될 수 있다.
상기 방법은 포화, 단일불포화, 또는 다중불포화(가령, 이중-불포화, 삼중-불포화 등) 지방족 케톤을 생산할 수 있다. 이러한 지방족 케톤은 대략 10개 내지 대략 40개 탄소의 탄소 사슬 길이(carbon chain length)를 가질 수 있다. 가령, 이러한 지방족 케톤은 대략 15개 내지 대략 35개, 대략 17개 내지 대략 34개, 대략 18개 내지 대략 33개, 대략 19개 내지 대략 33개, 대략 23개 내지 대략 29개, 대략 25개 내지 대략 27개, 또는 대략 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 또는 33개 탄소의 탄소 사슬 길이를 가질 수 있다.
본 발명에서는 또한, 정제된 폴리펩티드를 생산하는 방법을 제시하는데, 상기 방법은 본 발명에 개시된 분리된 핵산에 의해 인코딩되는 폴리펩티드를 생산하는데 충분한 조건 하에, 이러한 분리된 핵산을 포함하는 임의의 세포를 배양하는 단계를 포함한다. 구체적으로, 폴리펩티드는 OleA, OleB, OleC, OleD 또는 OleBC이다.
본 명세서에서, “정제하는”, “정제된”, 또는 “정제”라는 용어는 예로써, 분리(isolation) 또는 격리(separation)에 의한, 주변 환경으로부터의 분자의 이동 또는 분리를 의미한다. “실질적으로 정제된” 분자는 그들에 관련된 다른 성분이 적어도 대략 60%, 바람직하게는, 적어도 대략 75%, 더욱 바람직하게는, 적어도 대략 90%까지 존재하지 않는다. 본 명세서에서, 이들 용어는 또한, 시료로부터 오염물질의 제거를 지칭한다. 가령, 오염물질의 제거는 시료 내에서 올레핀의 비율을 증가시킬 수 있다. 가령, 올레핀이 숙주 세포에서 생산될 때, 이들 올레핀은 숙주 세포 단백질의 제거에 의해 정제될 수 있다. 정제후, 시료 내에서 올레핀의 비율이 증가한다.
본 명세서에서, “정제하는”, “정제된”과 “정제”라는 용어는 절대적인 순도(absolute purity)를 요하지 않는다. 이들은 상대적인 용어다. 따라서 예로써, 폴리펩티드가 세포 내에서 생산될 때, 정제된 폴리펩티드는 다른 세포 성분(가령, 핵산, 지질, 탄수화물, 또는 탄화수소)으로부터 실질적으로 격리된다. 다른 구체예에서, 정제된 올레핀 제조물이란 오염물질, 이를테면, 발효 이후에 존재할 수도 있는 오염물질이 실질적으로 존재하지 않는 올레핀이다. 일부 구체예에서, 시료의 중량으로 적어도 대략 50%가 올레핀으로 구성될 때 올레핀은 정제된 이다. 다른 구체예에서, 시료의 중량으로 적어도 대략 60%, 70%, 80%, 85%, 90%, 92%, 95%, 98%, 또는 99% 또는 그 이상이 올레핀으로 구성될 때 올레핀은 정제된 이다.
본 발명에서는 지방족 케톤을 생산하는 방법을 제시하는데, 상기 방법은 지방족 케톤을 생산하는데 충분한 조건 하에, 기질을 OleA와 함께 배양하는 단계를 포함한다. 구체적으로, 기질은 아실-CoA, 아실-AMP, 또는 아실-ACP를 포함할 수 있다.
본 발명에서는 탄화수소를 생산하는 방법을 제시하는데, 상기 방법은 탄화수소를 생산하는데 충분한 조건 하에 기질을 OleA, OleB, OleC, OleD, OleBC, 또는 이들의 조합과 함께 배양하는 단계를 포함한다. 기질은 아실-CoA, 아실-AMP, 또는 아실-ACP를 포함할 수 있다. 탄화수소를 생산하는데 이용되는 OleA, OleB, OleC, OleD, 또는 OleBC 단백질은 정제된 또는 정제되지 않은 단백질일 수 있다. 가령, 탄화수소를 생산하기 위하여 ole 유전자를 발현하는 생물체로부터 세포 용해질에 아실-CoA 기질이 첨가될 수 있다.
탄화수소를 생산하는 방법은 탄화수소를 생산하는데 충분한 조건 하에 기질을 OleA와 OleD와 함께 배양하는 단계를 포함할 수 있다. 선택적으로, 상기 방법은 OleB를 포함할 수 있다. 상기 방법은 탄화수소를 생산하는데 충분한 조건 하에 기질을 OleA, OleC와 OleD와 함께 배양하는 단계를 포함할 수 있다. 선택적으로, 상기 방법은 OleB를 포함할 수 있다.
아실-축합 펩티드에는 본 명세서에 기술된 방법을 이용하여 아실-ACP, 아실-CoA, 아실-AMP, 지방산, 그리고 이들의 혼합물의 축합을 촉진할 수 있는 펩티드가 포함된다. 일부 구체예에서, 이들 아실-축합 펩티드는 높은, 중간, 또는 낮은 기질 특이성(substrate specificity)을 갖는다. 일부 실례에서, 이들 아실-축합 펩티드는 더욱 기질 특이적이고, 특정 사슬 길이의 기질만을 수용할 것이다. 부가적으로, 당업자는 일부 아실-축합 펩티드가 다른 반응도 촉진할 것임을 인식할 것이다. 가령, 일부 아실-축합 펩티드는 아실-CoA, 아실-ACP, 아실-AMP, 아실-에스테르, 지방산, 또는 이들의 혼합물 이외에 다른 기질을 수용할 것이다. 이런 이유로, 이들 비-특이적 아실-축합 펩티드 역시 포함된다. 표 1에 열거된 OleA 서열 이외에, 아실-축합 효소의 실례는 공공연히 가용하다.
대안적 구체예에서, OleC와 OleD가 OleA 없이 올레핀을 생산하는데 이용될 수 있다. 다른 구체예에서, OleC가 OleA와 OleD 없이 올레핀을 생산하는데 이용될 수 있다.
마이콜산은 세균[가령, 미코박테리움(Mycobacterium)과 코리네박테리움(Corynebacterium)]에 의해 생산된 2-알킬-3-히드록시 지방산이다. 마이콜산은 종종, 세균 세포 벽 내로 통합된다. 이들 2-알킬-3-히드록시 지방산은 클라이젠(Claisen) 축합과 그 이후에, 케토 기의 환원으로부터 유래된다. 이러한 반응은 본 명세서에 기술된 탄화수소 합성 과정에서 OleA와 OleD에 의해 수행되는 효소 반응과 유사하다. 따라서 마이콜산 경로에서 첫 번째 단계는 탄화수소를 생산하기 위하여 OleC 또는 OleC와 OleD의 조합에 필요한 기질을 생산하는데 이용될 수 있다. 이에 더하여, 마이콜산 경로에 추가적인 유전자 변형은 알켄 생산 수준을 증가시킬 수 있다.
도 20에서는 마이콜산 생합성(예로써, Lea-Smith et al., Journal of Biological Chemistry, 282: 11000-11008 (2007); Portevin et al., Proceedings of the National Academy of Science, 101: 314-319 (2004) 참조)과 ole 유전자에 의한 올레핀 합성을 위한 제안된 합성 경로를 보여준다. 이들 두 경로의 조사에서 유사한 중간물질이 확인된다. 양쪽 경로에서 지방산 축합의 산물은 2-알킬-3-케토 지방 아실-CoA 또는 2-알킬-3-케토 지방 아실-ACP이다. 결과적으로, 마이콜산 생산 생물체, 예를 들면, 코리네박테리움 글루타미쿰(C. glutamicum)에서 oleC와 oleD의 과다발현은 마이콜산 생합성 경로를 “하이재킹(hijacking)”하여 올레핀의 생산으로 이어질 수 있다.
첫 번째 반응식에서, oleC와 oleD가 마이콜산 생산 생물체에서 과다발현된다. 적절한 숙주 생물체는 마이콜산 생산의 상실을 허용하고, 충분히 완성된 유전자 도구로 널리 확립된 산업용 숙주인 코리네박테리움 글루타미쿰(C. glutamicum)일 수 있다. 코리네박테리움 글루타미쿰(C. glutamicum)의 마이콜산 유전자의 지방산 특이성은 oleA, oleB, oleC와 oleD에서 관찰된 특이성 프로필(specificity profile)과 유사하다. oleC와 oleD의 과다발현은 pks 13의 산물을 도 21에 도시된 바와 같은 올레핀 합성 쪽으로 지향시킬 것이다.
두 번째 반응식에서, 마이콜산 생산 생물체에서 oleC만 과다발현된다. 이러한 제안된 반응식은 OleC가 2-알킬-3-히드록실 지방 아실 중간물질에서 독립적으로 작용하여 올레핀을 형성할 수 있다고 가정한다. 이러한 경로는 도 22에 도시된다.
oleC와 oleD를 발현하는 마이콜산 생산 균주에서 올레핀 생산의 강화는 아래의 유전자 변형을 완결함으로써 달성될 수 있다. OleC와 OleD에 대한 기질의 유용(siphoning off)을 예방하기 위하여, cmrA, 또는 이의 기능성 동족체를 적중시켜 OleD에 대한 기질인 2-알킬-3-케토 지방 아실-ACP의 축적을 가능하게 하면서 마이콜산의 형성을 예방할 수 있다. 부가적으로, fadD32, accA3, accD4, accD5, 또는 pks13의 과다발현은 요구되는 마이콜산 중간물질의 생산을 증가시켜, oleC와 oleD의 과다발현과 함께 더욱 많은 올레핀의 생산을 결과할 것이다.
일반적으로, 아실-축합 활성을 갖는 펩티드를 확인하는 여러 방법이 존재한다. 이들 방법 중에서 하나 이상을 이용한 산물 형성은 상기 펩티드가 아실-축합 활성을 갖는다는 것을 암시한다. 실시예 3에 열거된 시험관내 분석 이외에, 상기 펩티드는 세포 내에 외인성 핵산 서열로부터 발현될 수 있고, 이후 세포 용해질이 제조될 수 있다. 다양한 기질, 예를 들면, 아실-CoA, 아실-ACP, 아실-AMP, 아실-에스테르, 지방산, 또는 이들의 혼합물이 용해질에 첨가될 수 있고, 산물은 본 명세서에 기술된 GC/MS 또는 GC/FID 방법을 이용하여 검출될 수 있다. 다른 실례에서, 상기 펩티드는 정제되고, 이러한 펩티드를 발현하지 않는 세포로부터 세포 용해질(이후, 야생형 용해질)과 함께 배양될 수 있다. 정제된 펩티드, 야생형 용해질, 그리고 다양한 기질이 배양될 수 있다. 생성된 산물은 본 명세서에 기술된 GC/MS 또는 GC/FID 방법을 이용하여 특성화될 수 있다. 또 다른 실례에서, 아실-축합 활성은 단백질을 변성하기 위하여 가열된 세포 용해질의 존재에서 정제된 효소와 기질을 배양함으로써 특성화될 수 있다. 다른 실례에서, 정제된 펩티드와 기질은 배양될 수 있고, 생성된 산물은 본 명세서에 기술된 GC/MS 방법을 이용하여 특성화될 수 있다. 아실-축합 활성을 갖는 펩티드는 지방족 케톤을 생산하는 펩티드로서 확인된다. 당업자가 인식하는 바와 같이, 지방족 케톤을 이미 내포하는 세포 용해질이 이용될 때, 아실-축합 활성을 갖는 펩티드는 기질의 부가가 없는 용해질과 비교하여 지방족 케톤에서 증가(이를테면, 적어도 대략 10%, 적어도 대략 20%, 적어도 대략 50%, 또는 적어도 대략 90%의 증가)에 의해 인지될 것이다.
일부 사례에서, 축합은 하나 이상의 기질로부터 유래된 분자의 생산을 결과할 수 있다. 가령, 2개의 아실-CoA 분자의 축합은 적어도 하나의 CoA 분자를 산출할 수 있다. CoA 분자는 고도로 반응성인 유리 티올 모이어티(free thiol moiety, RSH)를 보유하기 때문에, 다양한 방법으로 검출될 수 있다. 이와 같은 방법의 한 가지는 411 nm에서 분광광도법으로 추적될 수 있는 디티오니트로벤조산(dithionitrobenzoic acid)(Ellman 시약)과의 반응이다. 대안으로, CoA는 모노브로모비만(monobromobimane)과 반응되고 HPLC에 의해 검출될 수 있다[Fahey, et al, Methods Enzymol. 143: 85-96, (1987)].
아실-축합 펩티드를 찾는데 생물정보학적 방법이 이용될 수 있다. 아실-축합은 “클라이젠(Claisen) 축합”으로 널리 알려져 있는 화학적 반응을 통하여 일어난다. 클라이젠(Claisen) 축합은 강한 염기의 존재하에 2개의 에스테르 또는 1개의 에스테르와 다른 카르보닐 화합물 사이에 일어나고 β-케토 에스테르 또는 β-디케톤을 발생시키는 탄소-탄소 결합 형성 반응이다.
아실-축합 펩티드는 전형적으로, Cys-His-Asn으로 구성되는 촉매 3인조(catalytic triad)를 내포한다. 이들 축합 효소는 아미노산 수준에서 거의 유사성이 없지만 공통의 3-차원 폴드(3-dimensional fold)를 공유한다. 하지만, 이들의 활성 부위는 현저한 유사성을 갖는다[Heath et al, Nat. Prod. Rep., 19: 581-596, (2002)].
전형적인 아실-축합 펩티드에는 본 발명에 게시된 OleA 서열, 예를 들면, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 88, SEQ ID NO: 135-464와 SEQ ID NO: 478-487, 이들 서열의 동족체, 본 명세서에 기술된 OleA 구조적 모티프 중에서 하나 이상을 보유하는 효소, 그리고 아실-축합 활성을 보이는 이들의 활성 단편/변이체가 포함된다.
재조합 생물체는 정의된 구조적 특징(가지화 정도, 포화, 그리고 탄소 사슬 길이)을 갖는 탄화수소와 탄화수소 중간물질을 생산하기 위하여 본 발명에 개시된 펩티드를 이용하여 조작될 수 있다. 탄화수소 중간물질을 만드는 한 가지 방법은 하나 이상의 효소, 예를 들면, 탄화수소 신타아제 활성, 아데닐화(adenylating) 펩티드, 데히드로게나아제, 데히드라타아제, 또는 아실-축합 효소를 발현하거나, 이들 효소의 발현을 증가시키거나, 또는 이들 효소의 더욱 활성 형태를 발현하는 단계를 수반한다. 탄화수소 생산을 증가시키기 위하여 조작될 수 있는 전형적인 효소에는 OleA, OleB, OleC, OleBC와 OleD, 그리고 지방산 생산을 증가시키거나 변경하는 다른 효소가 포함된다. 당업자가 인식하는 바와 같이, 이런 효소로부터 생산된 산물은 기질의 아실 사슬에 따라서 변한다.
아데닐화 펩티드에는 탄화수소 중간물질, 이를테면, α-치환된-β-케토산, 특히, α 위치에서 지방족 탄화수소를 보유하는 것들을 비롯한 β-케토산(ketoacid)에 아데노신 모노포스페이트(adenosine monophosphate)의 부가를 촉진할 수 있는 펩티드가 포함된다. 전술한 바와 같이, 이런 중간물질에서 α-지방족 기는 전형적으로, 탄화수소 사슬 내에서 하나 이상의 불포화 부위, 예를 들면, 1개, 2개, 또는 3개의 불포화 부위를 선택적으로 보유하는 선택적으로 가지형 탄화수소 사슬이다. 이런 아데닐화 펩티드는 또한, β-케토에스테를 형성하기 위한 β-히드록시 케토산에 아데노신 모노포스페이트의 부가를 촉진할 수도 있다. 이런 활성을 확인하는 방법은 본 명세서에 기술된다.
일부 실례에서, 아데닐화 펩티드는 더욱 기질 특이적이고, 예로써, CoA 또는 ACP 활성화된 β-케토에스테르만을 수용할 것이다. 부가적으로, 당업자는 일부 아데닐화 펩티드 반응 역시 인식할 것이다. 가령, 일부 아데닐화 펩티드는 α-치환된 β-케토산 이외에 다른 기질을 수용할 것이다. 이런 이유로, 이들 상대적으로 비-특이적인 아데닐화 펩티드 역시 포함된다. 아데닐화 펩티드의 실례는 공공연히 가용하다(예로써, 표 1과 2 참조). 종종, 아데닐화 펩티드는 부가적인 반응, 예를 들면, 아데닐화된 화합물의 CoA와 같은 다른 활성화 기(activating group)로 에스테르교환반응을 촉진할 수 있다. 이러한 활성은 신타아제 활성으로 간주된다. 실례는 아래와 같은 일단의 반응일 것이다:
1) R + ATP → R-OPO3-아데노신 + 피로포스페이트(pyrophosphate)
2) R-OPO3-아데노신 + CoASH → R-SCoA + AMP
아데닐화 활성을 갖는 펩티드를 확인하는 여러 방법이 존재한다. 이들 방법 중에서 하나 이상을 이용한 산물 형성은 상기 펩티드가 아데닐화 활성을 갖는다는 것을 암시한다. 본 명세서에 기술된 생체내 분석 이외에, 상기 펩티드는 세포 내에 외인성 핵산 서열로부터 발현될 수 있고, 이후 세포 용해질이 제조될 수 있다. 다양한 기질, 예를 들면, ATP가 용해질에 첨가될 수 있고, 산물은 본 명세서에 기술된 방법을 이용하여 검출될 수 있다. 다른 실례에서, 상기 펩티드는 정제되고, 이러한 펩티드를 발현하지 않는 세포로부터 세포 용해질과 함께 배양될 수 있다. 정제된 펩티드, 야생형 용해질, 그리고 다양한 기질이 배양될 수 있다. 생성된 산물은 본 명세서에 기술된 방법을 이용하여 특성화될 수 있다. 당업자가 인식하는 바와 같이, 아데닐화된 산물을 이미 내포하는 세포 용해질이 이용될 때, 아데닐화 활성을 갖는 펩티드는 기질의 부가가 없는 용해질과 비교하여 유리 PPi, AMP α-치환된-β-케토에스테르, 또는 AMP α-치환된-β-히드록시에스테르에서 증가에 의해 인지될 것이다. 전형적인 아데닐화 펩티드에는 OleC(가령, SEQ ID NO: 6), 표 1에 열거된 OleC 단백질, 그리고 아데닐화 활성을 나타내는 이들의 활성 단편/변이체가 포함된다.
데히드로게나아제 펩티드에는 지방족-케톤, 지방족 β-케토산, 또는 지방족 β-케토에스테르 분자에서 케토 기의 상응하는 히드록시 기로의 환원(탄소-산소 이중 결합을 가로질러 H2의 부가)을 촉진할 수 있는 펩티드가 포함된다. 이런 활성을 확인하는 방법은 본 명세서에 기술된다. 일부 실례에서, 이들 데히드로게나아제 펩티드는 더욱 기질 특이적이고, 예로써, α-지방족-β-케토에스테르의 CoA 또는 ACP 에스테르만을 수용할 것이다. 부가적으로, 당업자는 일부 데히드로게나아제 펩티드가 다른 반응도 촉진할 것임을 인식할 것이다. 가령, 일부 데히드로게나아제 펩티드는 β-케토에스테르 이외에 다른 기질을 수용할 것이다. 이런 이유로, 이들 비-특이적 데히드로게나아제 펩티드 역시 포함된다. 데히드로게나아제 펩티드의 실례는 OleD(가령, SEQ ID NO: 8)이고, 공공연히 가용한 데히드로게나아제 펩티드는 표 1에 열거된다.
데히드로게나아제 활성을 갖는 펩티드를 확인하는 여러 방법이 존재한다. 이들 방법 중에서 하나 이상을 이용한 산물 형성은 상기 펩티드가 데히드로게나아제 활성을 갖는다는 것을 암시한다. 본 명세서에 기술된 생체내 분석 이외에, 상기 펩티드는 세포 내에 외인성 핵산 서열로부터 발현될 수 있고, 이후 세포 용해질 또는 정제된 펩티드를 내포하는 시험관내 분석물이 제조될 수 있다. 다양한 기질, 이를테면, NADPH 및/또는 NADH가 상기 분석물에 첨가될 수 있고, 산물은 본 명세서에 기술된 GC/MS 방법을 이용하여 검출될 수 있다.
다른 실례에서, 상기 펩티드는 정제되고, 이러한 펩티드를 발현하지 않는 세포로부터 세포 용해질과 함께 배양될 수 있다. 정제된 펩티드, 야생형 용해질, 그리고 다양한 기질(가령, 지방산, 아실-CoA, 아실-AMP, 아실-ACP, α-알킬-β-케토산, α-알킬-β-케토 에스테르, 또는 지방족 케톤)이 배양될 수 있다. 생성된 산물은 본 명세서에 기술된 방법을 이용하여 특성화될 수 있다(예로써, 실시예 1 참조).
또 다른 실례에서, 데히드로게나아제 활성은 케톤 기질의 존재에서 NADPH 또는 NADH의 데히드로게나아제 의존성 산화를 분광광도법으로 모니터링함으로써 검출될 수 있다. 데히드로게나아제 활성은 340 nm에서 반응 용액의 흡광도(absorbance)에서 감소로서 검출된다.
또 다른 실례에서, 데히드로게나아제 활성은 단백질을 변성하기 위하여 가열된 세포 용해질의 존재에서 정제된 효소와 기질(가령, NAD(P)H, α-지방족-β-케토에스테르 및/또는 α-지방족-β-케토산)을 배양함으로써 특성화될 수 있다. 데히드로게나아제 활성을 갖는 펩티드는 하나 이상의 앞서 기술된 반응으로부터 β-히드록시산 또는 에스테르(특히, 활성화된 에스테르) 분자를 생산하는 펩티드로서 확인된다. 당업자가 인식하는 바와 같이, β-히드록시산 및/또는 에스테르 산물을 이미 내포하는 세포 용해질이 이용될 때, 데히드로게나아제 활성을 갖는 펩티드는 기질의 부가가 없는 용해질과 비교하여 NADP, β-히드록시산 및/또는 에스테르 분자에서 증가에 의해 인지될 것이다.
전형적인 데히드로게나아제 펩티드에는 OleD(가령, SEQ ID NO: 8)와 표 1에 열거된 관련된 효소가 포함된다. 부가적 OleD 효소는 본 발명에 개시된 OleD 모티프와 본 명세서에 기술된 방법을 이용하여 다양한 데이터베이스를 검색함으로써 확인될 수 있다.
본 발명에서는 또한, 히드롤라아제(hydrolase) 활성을 갖는 펩티드를 인코딩하는 핵산을 제시한다. 특히, 펩티드는 β-케토 또는 β-히드록시 에스테르 가수분해 활성을 가질 것이다. 이런 펩티드는 아마도 앞서 기술된 모든 기질의 에스테르의 가수분해(hydrolysis)를 촉진하여 상응하는 카르복실산을 생산할 것이다. 에스테르 히드롤라아제는 HPLC(또는 다른 널리-공지된 기술)로 산물, 이를테면, β-케토산 또는 β-히드록시산의 생산을 모니터링함으로써 검출될 수 있다. 다른 구체예에서, 이러한 유리 산(free acid)의 형성에 기인한 pH에서 결과적 감소가 모니터링될 수 있다. 대안으로, 에스테르 가수분해가 지방 에스테르로부터 방출된 모이어티, 이를테면, CoASH, AMP, 또는 포스페이트의 축적을 측정함으로써 모니터링될 수 있다. 당업자에게, 이들 화합물을 모니터링하는 방법은 널리 공지되어 있고, 이들 방법 중에서 일부는 앞서 기술되었다. 포스페이트는 예로써, 몰리브데이트(molybdate)와 말라카이트 그린(malachite green)과의 반응에 의해 모니터링될 수 있다. 부가적 분석물은 상업적으로[가령, Bio Vision, Inc.(Mountain View, CA)로부터] 획득될 수 있다.
본 발명에서는 하나 이상(가령, 대략 1개, 대략 2개, 대략 3개, 대략 4개, 대략 5개, 대략 10개, 대략 15개, 대략 20개, 대략 25개, 대략 30개, 대략 35개, 대략 40개, 대략 45개, 또는 대략 50개)의 아미노산 치환, 부가, 삽입, 또는 결실을 포함하는 OleA를 인코딩하는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 분리된 폴리펩티드를 제시한다. 가령, 분리된 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12와 SEQ ID NO: 18로 구성된 군에서 선택되는 아미노산 서열을 포함할 수 있는데, 여기서 상기 아미노산 서열은 하나 이상(가령, 대략 1개, 대략 2개, 대략 3개, 대략 4개, 대략 5개, 대략 10개, 대략 15개, 대략 20개, 대략 25개, 대략 30개, 대략 35개, 대략 40개, 대략 45개, 또는 대략 50개)의 아미노산 치환, 부가, 삽입, 또는 결실을 포함한다.
본 발명에서는 생물학적 활성을 갖는 폴리펩티드를 제시한다. 폴리펩티드의 생물학적 활성은 클라이젠(Claisen) 축합 활성일 수 있다. 구체적으로, 폴리펩티드의 생물학적 활성은 2개의 아실티오에스테르의 축합일 수 있다.
본 발명에서는 하나 이상(가령, 대략 1개, 대략 2개, 대략 3개, 대략 4개, 대략 5개, 대략 10개, 대략 15개, 대략 20개, 대략 25개, 대략 30개, 대략 35개, 대략 40개, 대략 45개, 또는 대략 50개)의 아미노산 치환, 부가, 삽입, 또는 결실을 포함하는 OleD를 인코딩하는 아미노산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 분리된 폴리펩티드를 제시한다. 가령, 분리된 폴리펩티드는 SEQ ID NO: 8, SEQ ID NO: 16과 SEQ ID NO: 22로 구성된 군에서 선택되는 아미노산 서열을 포함하는데, 여기서 상기 아미노산 서열은 하나 이상(가령, 대략 1개, 대략 2개, 대략 3개, 대략 4개, 대략 5개, 대략 10개, 대략 15개, 대략 20개, 대략 25개, 대략 30개, 대략 35개, 대략 40개, 대략 45개, 또는 대략 50개)의 아미노산 치환, 부가, 삽입, 또는 결실을 포함한다.
본 발명에서는 OleA 단백질과 동일한 생물학적 활성을 갖는 폴리펩티드를 인코딩하는 분리된 핵산을 제시한다. 가령, 본 발명에서는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 8, SEQ ID NO: 12, SEQ ID NO: 16, SEQ ID NO: 18과 SEQ ID NO: 22로 구성된 군에서 선택되는 아미노산 서열을 포함하는, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 아미노산 서열로 구성되는 폴리펩티드와 동일한 생물학적 활성을 갖는 폴리펩티드를 인코딩하는 분리된 핵산을 제시한다. 바람직하게는, 분리된 핵산은 (i) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 11, SEQ ID NO: 15, SEQ ID NO: 17과 SEQ ID NO: 21로 구성된 군에서 선택되는 핵산 서열 또는 이의 단편, 또는 (ii) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 11, SEQ ID NO: 15, SEQ ID NO: 17과 SEQ ID NO: 21로 구성된 군에서 선택되는 핵산 서열의 보체 또는 이의 단편에 혼성화되는 핵산 서열을 포함할 수 있다.
혼성화 반응을 수행하기 위한 가이던스는 Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1 - 6.3.6에서 찾아볼 수 있다. 상기 참고문헌에는 수성과 비-수성 방법이 기술되는데, 이들 중에서 어느 한 방법이 이용될 수 있다. 본 명세서에 언급된 특정 혼성화 조건은 아래와 같다: 1) 낮은 엄밀도 혼성화 조건(low stringency hybridization condition): 대략 45℃에서 6X 염화나트륨/구연산나트륨(SSC), 이후 적어도 5O℃에서 0.2X SSC, 0.1% SDS에서 2회 세척(이들 세척의 온도는 낮은 엄밀도 조건의 경우에 55℃까지 증가될 수 있다); 2) 중간 엄밀도 혼성화 조건(medium stringency hybridization condition): 대략 45℃에서 6X SSC, 이후 6O℃에서 0.2X SSC, 0.1% SDS에서 1회 이상 세척; 3) 높은 엄밀도 혼성화 조건(high stringency hybridization condition): 대략 45℃에서 6X SSC, 이후 65℃에서 0.2X. SSC, 0.1% SDS에서 1회 이상 세척; 바람직하게는, 4) 매우 높은 엄밀도 혼성화 조건: 65℃에서 0.5M 인산나트륨, 7% SDS, 이후 65℃에서 0.2X SSC, 0.1% SDS에서 1회 이상 세척. 달리 명시되지 않는 경우에, 매우 높은 엄밀도 조건(4)이 선호되는 조건이다. 본 명세서에서, “혼성화”라는 용어는 일반적으로, 낮은 엄밀도, 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건을 지칭한다.
본 발명에서는 생물학적 활성을 갖는 폴리펩티드를 제시한다. 생물학적 활성은 산화환원효소 활성일 수 있다. 구체적으로, 생물학적 활성은 케토-기(가령, 케톤, 지방족 케톤, α-알킬-β-케토산, α-알킬-β-케토 에스테르)의 환원일 수 있다.
탄화수소 신타아제 활성은 지방 아실 사슬을 내포하는 기질, 이를테면, 아실-CoA, 아실-ACP, 또는 지방산의 탄화수소 또는 탄화수소 중간물질로의 변환을 유도하는 하나 이상의 펩티드의 활성이다. 탄화수소 신타아제 활성을 갖는 펩티드의 실례에는 OleA, OleB, OleC, OleD와 OleBC가 포함된다.
탄화수소 신타아제 활성은 예로써, 상보 분석(complementation assay)을 이용하여 조사될 수 있다(하기 실시예 6 참조). OleA, OleB, OleC와 OleD의 발현 이후에 탄화수소를 생산하는 것으로 알려져 있는 생물체가 검사 숙주(test host)로서 이용될 수 있다. 가령, 후보 OleC가 탄화수소 신타아제 활성에 대하여 조사되는 경우에, 검사 숙주는 oleA와 oleD만을 발현하고 oleC를 발현하지 않도록 조작된다. 후보 oleC는 이후, oleC가 결핍된 검사 숙주에서 발현된다. 검사 숙주가 탄화수소를 생산하면, 후보 OleC는 탄화수소 신타아제 활성을 갖는 것으로 간주된다.
본 발명에 개시된 OleA, OleBC 또는 OleC와 OleD 서열과 실시예 6에 기술된 상보 분석을 이용하여, 부가적 탄화수소와 탄화수소 중간물질-형성 유전자가 확인될 수 있다. 탄화수소와 이의 중간물질은 대장균(E. coli)에서 OleA, OleBC 또는 OleC와 OleD를 발현함으로써 형성될 수 있다. 이런 이유로, 탄화수소를 생산하도록 조작된 대장균(E. coli) 또는 탄화수소를 자연적으로 생산하는 다른 생물체[가령, 스테노트로포모나스 말토필리아(S. maltophilia), 클로로플렉서스 아그레간스(Chloroflexus aggregans), 크사노토모나스 악소노포디스(Xanothomonas axonopodis), 또는 아스로박터 아우레스켄스(A. aurescens)]는 조사되는 특정 DNA 서열이 숙주 세포에서 발현되지 않는 경우에, 상기 특정 DNA 서열 또는 단백질의 탄화수소 신타아제 활성을 결정하는데 이용될 수 있다.
본 명세서에서, “숙주 세포”는 본 명세서에 기술된 산물[가령, 본 명세서에 기술된 올레핀]을 생산하는데 이용되는 세포이다. 숙주 세포는 선택된 유전자를 발현 또는 과다발현하거나, 또는 선택된 유전자의 발현을 약화시키기 위하여 변형될 수 있다.
실례로써, 조사되는 DNA 서열이 OleA 단백질 서열의 동족체를 인코딩하면, 이는 oleC와 oleD 서열을 이미 발현하지만 oleA 서열을 발현하지 않는 숙주에서 발현된다. 이러한 OleA 동족체는 숙주가 oleA의 동족체를 발현할 때 탄화수소 또는 탄화수소 중간물질을 생산하는 경우에 활성(즉, 탄화수소 신타아제 활성)을 갖는 것으로 간주된다.
본 발명에서는 탄화수소의 생산에 유용한 효소를 확인하는 방법을 제시하는데, 상기 방법은 아래의 단계를 포함한다: (i) (a) OleA와 OleD, (b) OleA와 OleC, 그리고 (c) OleC와 OleD로 구성된 군에서 선택되는 폴리펩티드를 포함하는 세포를 탄화수소를 생산하는 능력을 갖는 것으로 생각되는 효소를 인코딩하는 핵산으로 형질전환시키는 단계; 그리고 (ii) 세포가 탄화수소를 생산하는 지를 결정하는 단계, 여기서 상기 세포에 의한 탄화수소 생산의 존재는 상기 핵산이 탄화수소의 생산에 유용한 폴리펩티드를 인코딩함을 지시한다.
가령, 상기 방법은 (i) (a) OleA와 OleD, (b) OleA와 OleC, (c) OleC와 OleD, (d) OleA와 OleBC, 그리고 (e) OleBC와 OleD로 구성된 군에서 선택되는 폴리펩티드를 포함하는 세포를 탄화수소를 생산하는 능력을 갖는 것으로 생각되는 효소를 인코딩하는 핵산으로 형질전환시키는 단계, 여기서 OleA는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12, 또는 SEQ ID NO: 18에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 공유하고; 여기서 OleC는 SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20, 또는 SEQ ID NO: 88에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 공유하고; 그리고 여기서 OleD는 SEQ ID NO: 8, SEQ ID NO: 16, 또는 SEQ ID NO: 22에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 공유하고; (ii) 세포가 탄화수소를 생산하는 지를 결정하는 단계를 포함할 수 있고, 여기서 상기 세포에 의한 탄화수소 생산의 존재는 상기 핵산이 탄화수소의 생산에 유용한 폴리펩티드를 인코딩함을 지시한다.
탄화수소를 자연적으로(유전자 조작 없이) 생산하는 생물체는 본 명세서에 기술된 바와 같이 지방산 생합성 경로를 변경함으로써 특이적인 탄소 사슬 특징을 갖는 탄화수소를 과다생산 또는 생산하도록 조작될 수 있다. 탄화수소를 생산하는 것으로 알려져 있고 본 명세서에 기술된 교시를 이용하여 탄화수소 생산을 변경하도록 조작될 수 있는 전형적인 생물체에는 아시네토박터(Acinetobacter) 종, 클로로플렉서스(Chloroflexus) 종, 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 미크로코커스(Micrococcus) 종, 아스로박터(Arthrobacter) 종, 비브리오 푸르니씨(Vibrio furnissii), 그리고 남조류(Cyanobacteria)가 포함되지만 이들에 국한되지 않는다. 이들 유전자 조작된 재조합 생물체는 탄화수소를 생산하는데 유용하다.
유전자 조작된 재조합 생물체는 또한, 지방족 케톤을 생산하는데 이용될 수 있다. 가령, oleA, oleC와 oleD를 보유하는 생물체는 oleC와 oleD를 인코딩하는 유전자를 결실 또는 약화시킴으로써 지방족 케톤을 생산하도록 조작될 수 있다. 결과의 유전자 조작된 생물체는 oleC와 oleD가 결실 또는 약화될 때 내인성 oleA의 발현의 결과로써 케톤을 생산한다. oleA와 oleC를 보유하는 생물체는 oleC를 인코딩하는 유전자를 결실 또는 약화시킴으로써 지방족 케톤을 생산하도록 조작될 수 있다. 유사하게, oleA와 oleD를 보유하는 생물체는 oleD를 인코딩하는 유전자를 결실 또는 약화시킴으로써 지방족 케톤을 생산하도록 조작될 수 있다. 결과의 유전자 조작된 생물체는 oleC 또는 oleD가 결실 또는 약화될 때 내인성 oleA의 발현의 결과로써 케톤을 생산한다.
다른 실례에서, 탄화수소를 생산하는 재조합 생물체는 OleA, OleB, OleC, OleD, OleBC, 그리고 이들의 조합에서 선택되는 하나 이상의 펩티드를 과다발현하도록 조작된다. 이들 유전자는 탄화수소를 자연적으로 생산하는 생물체, 이를테면, 앞서 기술된 생물체에서 과다발현되거나, 또는 이들은 탄화수소를 자연적으로 생산하지 못하는 생물체에서 과다발현될 수 있다.
본 명세서에서, “과다발현”은 상응하는 야생형 세포에서 정상적으로 발현되는 것보다 높은 농도로 세포에서 핵산, 폴리펩티드, 또는 탄화수소를 발현하거나 발현하도록 유도되는 것을 의미한다. 가령, 폴리펩티드는 이러한 폴리펩티드가 동일한 종의 비-재조합 세포에서 농도와 비교하여 재조합 세포에서 더욱 높은 농도로 존재할 때, 재조합 세포에서 “과다발현”될 수 있다.
펩티드를 과다발현하는 재조합 생물체의 실례에는 OleA, OleB, OleC, OleD, OleBC, 또는 이들의 조합을 인코딩하는 핵산을 발현하는 생물체가 포함된다. 다른 실례에는 OleA, OleB, OleC, OleD, OleBC, 또는 이들의 조합의 내인성 코딩 서열의 상류에 외인성 프로모터 서열이 도입된 생물체가 포함된다. 일부 실례에서, 하나 이상의 지방산 생합성 경로 변경 유전자의 과다발현이 OleA, OleB, OleC, OleBC, 또는 OleD와 공동으로 과다발현될 수 있다.
OleA(가령, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 12와 SEQ ID NO: 18), OleB(가령, SEQ ID NO: 10), OleC(가령, SEQ ID NO: 6, SEQ ID NO: 14, SEQ ID NO: 20과 SEQ ID NO: 88), OleD(가령, SEQ ID NO: 8, SEQ ID NO: 16과 SEQ ID NO: 22) 중에서 하나 이상, 또는 이들 서열 중에서 하나 이상의 변이체 또는 동족체를 인코딩하는 하나 이상의 핵산 분자로 유전자 조작된(가령, 형질전환된, 형질도입된, 또는 형질감염된) 재조합 생물체(가령, 세균, 진균 또는 진핵 세포)가 제시된다. 이들 서열은 벡터 구조체로부터, 유전자 통합(gene integration)후 염색체로부터 직접적으로, 또는 염색체외 어레이(extrachromosomal array)로부터 발현될 수 있다. 가령, OleA(가령, SEQ ID NO: 2), OleC(가령, SEQ ID NO: 6), 또는 OleD(가령, SEQ ID NO: 8) 단백질은 원하는 재조합 생물체 내에서 기능성인 유전자 발현 제어 요소(gene expression control element), 예를 들면, 대장균(E. coli) 내에서 T7 프로모터에 작동가능하게 연결된 핵산에 의해 인코딩된다.
본 명세서에서, “제어 요소”는 전사 제어 요소(transcriptional control element)를 의미한다. 제어 요소에는 프로모터(promoter)와 인헨서(enhancer)가 포함된다. “프로모터 요소”, “프로모터”와 “프로모터 서열”이라는 용어는 유전자의 발현을 활성화시키는 스위치로서 기능하는 DNA 서열을 지칭한다. 유전자는 활성화되면, 전사되거나, 또는 전사에 참여하고 있다고 일컬어진다. 전사는 유전자로부터 mRNA의 합성을 수반한다. 이런 이유로, 프로모터는 전사 조절 요소(transcriptional regulatory element)로서 기능하고, 또한 유전자의 mRNA로의 전사를 개시하기 위한 부위를 제공한다. 제어 요소는 전사에 관여하는 세포 단백질과 특이적으로 상호작용한다[Maniatis et al., Science 236: 1237 (1987)].
이종성 발현 시스템에서 단백질을 발현하는 방법은 당분야에 널리 공지되어 있다. 전형적으로, 세균 또는 효모 재조합 생물체는 자연적인 형질전환(transformation), 전기천공(electroporation), 접합(conjugation), 또는 형질도입(transduction)에 의해 형질전환된다. 결과의 발현 구조체는 플라스미드와 같이 염색체외(extrachromosomal)이거나, 또는 재조합 이후에 염색체 내로 통합될 수 있다. 진핵 세포에서, 전형적으로, 재조합 생물체는 특정 재조합 생물체에 적합한 임의의 방법을 이용하여 발현 벡터로 형질감염된다(또는 이러한 발현 벡터를 내포하는 바이러스로 감염된다). 이런 형질감염 방법 역시 당분야에 널리 공지되어 있고, 비제한의 전형적인 방법이 본 명세서에서 기술된다. 형질전환된 재조합 생물체는 발현 카세트(expression cassette) 내에 핵산에 의해 인코딩되는 단백질을 발현할 수 있다. 다른 구체예에서, 하나 이상의 발현 벡터로 재조합 생물체의 일시적 또는 안정적 형질감염이 또한, 수행될 수 있다. 본 발명에 개시된 단백질을 생산하기 위하여, 일차 세포주(primary cell line)와 불멸 세포주(immortal cell line)를 비롯하여, 많은 상이한 유형의 재조합 생물체, 이를테면, 세균, 효모, 조류, 진균, 곤충, 척추동물 세포(가령, 포유동물 세포), 그리고 식물 세포가 이용될 수 있다. 각 세포 유형의 다수의 전형이 통상적으로 이용되고, 예로써, ATCC, Pharmacia와 Invitrogen을 비롯한 광범위한 상업적 출처로부터 가용하다.
다양한 효모 균주와 효모 유래된 벡터가 이종성 단백질의 생산에 통상적으로 이용된다. 가령, 적합한 효모 세포의 특정한 비제한적 실례에는 사카로미세스 세레비시아(Saccharomyces cerevisiae) 세포, 아스페르길루스(Aspergillus) 세포, 트리코더마(Trichoderma) 세포, 뉴로스포라(Neurospora) 세포, 푸사륨(Fusarium) 세포, 또는 크리소스포리움(Chrysosporium) 세포가 포함된다. 특정한 비제한적 실례에서, OleA, OleB, OleC, OleBC, 또는 OleD 펩티드를 생산하기 위하여, Invitrogen(Carlsbad, California)으로부터 구입된 피치아 파스토리스(Pichia pastoris) 발현 시스템이 이용될 수 있다. 이런 시스템에는 적절한 피치아 파스토리스(Pichia pastoris) 균주, 벡터, 시약, 형질전환체, 염기서열분석 프라이머, 그리고 배지가 포함된다. 가령, 가용한 균주에는 KM71H[독립영양성(prototrophic) 균주], SMD1168H(독립영양성 균주), 그리고 SMD1168(pep4 돌연변이 균주)(Invitrogen)이 포함되지만 이들에 국한되지 않는다.
사카로미세스 세레비시아(Saccharomyces cerevisiae)는 숙주로서 통상적으로 이용되는 다른 효모 종이다. 트립토판(tryptophan)을 생산할 수 없는 돌연변이 사카로미세스(Saccharomyces)에서 발현 벡터로서 플라스미드 YRp7[Stinchcomb et al, Nature, 282: 39, (1979); Kingsman et al, Gene, 7: 141, (1979); Tschemper et al., Gene, 10: 157, (1980)]이 통상적으로 이용된다. 상기 플라스미드는 돌연변이 효모 균주 내로 형질전환될 때 상기 돌연변이 효모 균주가 트립토판을 생산하고 트립토판의 부재에서 성장할 수 있도록 하는 trp1 유전자를 내포한다. trp1 유전자가 선별 마커로서 이용될 수 있는 숙주 균주의 실례에는 ATCC No. 44,076과 PEP4-1이 포함되지만 이들에 국한되지 않는다(Jones, Genetics, 23: 12, (1977)). 효모 재조합 생물체 게놈 내에서 trp1 손상의 존재는 트립토판의 부재에서 성장으로 형질전환을 검출하기 위한 효과적인 특징을 제공한다.
효모 재조합 생물체는 Hinnen, Proc . Natl . Acad . Sci. USA, 75: 1929, (1978)에 기술된 바와 같이, 폴리에틸렌 글리콜(polyethylene glycol) 방법을 이용하여 형질전환될 수 있다. 부가적 효모 형질전환 프로토콜은 Gietz et al., Nucl . Acids Res., 20(17): 1425, (1992)와 Reeves et al., FEMS, 99(2-3): 193-197, (1992)에서 열거된다.
많은 세포 생물체, 예를 들면, 효모, 동물과 세균이 그들의 세포 막의 필수 성분으로서 지질(lipid)을 생산한다. 이들 생물체가 지질로서 이용되는 지방 아실 기를 생산하는 방법은 고도로 보존된다. 그럼에도 불구하고, 일부 지질 중간물질, 이를테면, 아실-coA와 아실-ACP의 이용도(availability)에 영향을 줄 수 있는 경로 내에 변이가 존재한다. 이들 지질 중간물질은 또한, Ole 단백질에 의한 지방족 케톤과 탄화수소의 생산에서 핵심 기질이다. 사카로미세스 세레비시아(Saccharomyces cerevisiae)에서, 아실-coA는 아실-조효소 A-결합 단백질(ACBP)에 결합되고, 상기 단백질은 티오에스테라아제에 의한 가수분해로부터 아실-coA를 보호한다(예로써, Rose et al., PNAS, 89: 11287-11291 (1992); Feddersen et al., Biochem . J, 407: 219-230 (2007) 참조). Ole 단백질은 탄화수소 또는 지방족 케톤 합성을 위한 기질로서 이용되는 아실-coA에 대하여 ACBP와 경쟁할 것이다. 이런 이유로, 아실-CoA에 대한 경쟁을 감소시키기 위하여 ACBP에 변형이 필요하다. ACBP에서 조건 돌연변이(conditional mutation)는 사카로미세스 세레비시아(S. cerevisiae)에서 아실-CoA의 풀(pool)을 방출시키는 것으로 기존 문헌(예로써, Gaigg et al., Mol . Biol . Cell, 12: 1147-1160 (2001) 참조)에서 밝혀졌다. 이런 이유로, 가용한 유리 아실-CoA의 양이 통제되는 숙주 균주, 이를테면, 사카로미세스 세레비시아(S. cerevisiae) Y700pGAL1-ACB1 균주(예로서, Gaigg et al., 상기 참조) 내에서 ole 유전자의 발현은 생산되는 지방족 케톤 또는 탄화수소의 더욱 높은 수준을 결과할 것이다.
적절한 발현 벡터의 작제에서, 이들 유전자와 연관된 종결 서열(termination sequence)은 발현이 요구되는 서열의 3' 영역 내로 결찰(ligation)된다. 원핵 tRNA, 복제 기점(origin of replication)과 종결 서열을 인코딩하는 핵산 서열을 전사할 수 있는 효모-양립성 프로모터를 내포하는 임의의 플라스미드 벡터가 적합하다.
다른 적절한 재조합 생물체는 세균 세포이다. 재조합 생물체일 수도 있는 적절한 세균 종족의 특정한 무제한적 실례에는 아시도박테리아(Acidobacteria), 악티노박테리아(Actinobacteria), 아퀴피카(Aquificae), 박테로이데테스(Bacteroidetes), 클라미디아(Chlamydiae), 클로로비(Chlorobi), 클로로플렉시(Chloroflexi), 크리시오제네테스(Chrysiogenetes), 시아노박테리아(Cyanobacteria), 데페리박테레스(Deferribacteres), 데이노코커스(Deinococcus), 테르무스(Thermus), 딕티오글로미(Dictyoglomi), 피브로박테레스(Fibrobacteres), 페르미쿠테스(Firmicutes), 푸소박테리아(Fusobacteria), 젬마티모나데테스(Gemmatimonadetes), 렌티스페라(Lentisphaerae), 니트로스피라(Nitrospira), 플랑크토미세테스(Planctomycetes), 프로테오박테리아(Proteobacteria), 스피로헤타(Spirochaetes), 테네리쿠테스(Tenericutes), 테르모데설포박테리아(Thermodesulfobacteria), 테르모미크로비아(Thermomicrobia), 테르모토가(Thermotogae), 그리고 베루코마이크로비아(Verrucomicrobia)가 포함된다.
재조합 생물체로서 이용될 수 있는 세균 종의 특정한 무제한적 실례에는 대장균(Escherichia coli), 테르무스 테르모필루스(Thermus thermophilus), 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 바실루스 스테아로테르모필루스(Bacillus stearothermophilus), 메타노코커스 자나쉬아이(Methanococcus jannaschii), 메타노사르시나 마제이(Methanosarcina mazei), 메타노박테리움 테르모아우토트로피쿰(Methanobacterium thermoautotrophicum), 메타노코커스 마리팔루디스(Methanococcus maripaludis), 메타노피루스 칸들레리(Methanopyrus kandleri), 할로박테리움(Halobacterium), 이를테면, 할로페락스 볼카니(Haloferax volcanii)와 할로박테리움(Halobacterium) 종 NRC-i, 아케오글로부스 펄지두스(Archaeoglobus fulgidus), 파이로코커스 푸리오수스(Pyrococcus furiosus), 파이로코커스 호리코쉬(Pyrococcus horikoshii), 파이로바컬럼 아에로필럼(Pyrobaculum aerophilum), 파이로코커스 아비씨(Pyrococcus abyssi), 설포로부스 솔파타리쿠스(Sulfolobus solfataricus), 설포로부스 토코다이(Sulfolobus tokodaii), 에어로피룸 페르닉스(Aeropyrum pernix), 테르모플라스마 아시도필룸(Thermoplasma acidophilum), 그리고 테르모플라스마 볼카니움(Thermoplasma volcanium)이 포함되지만 이들에 국한되지 않는다.
한 구체예에서, 재조합 생물체는 대장균(E. coli) 세포, 스테노트로포모나스 말토필리아(S. maltophilia) 세포, 슈도모나스(Pseudomonas) 종 세포, 바실루스(Bacillus) 종 세포, 방선균(Actinomycetes) 세포, 또는 로도코커스(Rhodococcus) 속에 속하는 세포이다. 재조합 생물체 내로 구조체의 도입은 인산칼슘(calcium phosphate) 형질감염, DEAE-덱스트란 매개된 형질감염, 폴리브렌(polybrene) 매개된 형질감염, 원형질체 융합(protoplast fusion), 리포좀(liposome) 매개된 형질감염, 접합(conjugation), 자연 형질전환(natural transformation), 전기천공(electroporation), 그리고 당분야에 공지된 다른 방법이 포함되지만 이들에 국한되지 않는 다양한 방법에 의해 달성될 수 있다.
또 다른 적합한 재조합 생물체는 식물 세포[가령, 석송(club moss), 양치류(fern), 피자식물(angiosperm), 또는 겉씨식물(gymnosperm)]이다. 부가적으로 적합한 재조합 생물체에는 조류(algae), 이끼(moss)와 지의류(lichen)가 포함되지만 이들에 국한되지 않는다. 임의의 공지된 방법이 식물 세포 형질전환, 배양과 재생(regeneration)에 이용될 수 있다. 식물 세포 내로 외래 DNA를 도입하는 방법에는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)와 이원 벡터(binary vector)를 비롯한 적절한 Ti 벡터의 이용을 필요로 하는 운반; 화학적으로 유도된 운반(가령, 폴리에틸렌 글리콜 이용); 바이오리스틱(biolistic); 미세주입(microinjection)이 포함되지만 이들에 국한되지 않는다(예로써, An et al., Plant Molecular Biology Manual, A3: 1-19 (1988) 참조). 구조성 프로모터, 예를 들면, 많은 식물 조직에서 발현되는 콜리플라워 모자이크 바이러스(cauliflower mosaic virus, CaMV) 35S 프로모터, 장기- 또는 조직-특이적 프로모터, 그리고 화학물질, 이를테면, 메틸 자스미테이트(methyl jasminate), 살리실산(salicylic acid), 또는 독성 완화제(safener)에 의해 유도될 수 있는 프로모터를 비롯하여, 식물 세포 내에서 이종성 유전자의 발현에 적합한 다양한 프로모터가 당분야에 공지되어 있다.
재조합 생물체는 적절한 조건 하에 적당한 세포 밀도까지 성장된다. 관심 서열이 유도성 프로모터에 작동가능하게 연결되면, 발현을 유도하기 위한 적절한 환경 변화가 이루어진다. 산물(가령, 탄화수소)이 재조합 생물체 내에 축적되면, 이들 세포는 예로써, 원심분리(centrifugation) 또는 여과(filtration)에 의해 수확된다. 전체 세포 추출은 전체 세포로부터 산물을 정제하기 위하여 수행될 수 있다. 대안적 구체예에서, 원하는 산물을 회수하기 위하여 생물체, 배지와 산물이 함께 수집되는 전체 세포 추출이 수행될 수 있다. 이후, 전체 배양 추출물은 원하는 산물을 획득하기 위하여 정제될 수 있다. 재조합 생물체가 산물을 배지 내로 분비하면, 이들 세포와 배지는 분리된다. 배지는 이후, 원하는 산물의 정제를 위하여 유지된다.
본 발명에서는 게놈 핵산 서열(genomic nucleic acid sequence)의 상류에서 생물체의 게놈 내로 안정적으로 통합되는 외인성 핵산 서열(exogenous nucleic acid)을 포함하는 유전자 조작된 생물체를 제시하는데, 상기 게놈 핵산 서열은 (a) ole 유전자의 핵산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 가지고 (b) 폴리펩티드를 인코딩한다. 가령, 유전자 조작된 생물체는 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 87, 그리고 SEQ ID NO: 135-464 중에서 하나를 인코딩하는 핵산 서열로 구성된 군에서 선택되는 핵산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 게놈 핵산 서열의 상류에서 생물체의 게놈 내로 안정적으로 통합되는 외인성 핵산 서열을 포함할 수 있다. 바람직하게는, 유전자 조작된 생물체는 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21과 SEQ ID NO: 87로 구성된 군에서 선택되는 핵산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 게놈 핵산 서열의 상류에서 생물체의 게놈 내로 안정적으로 통합되는 외인성 핵산 서열을 포함할 수 있다.
바람직한 구체예에서, 유전자 조작된 생물체는 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21과 SEQ ID NO: 87로 구성된 군에서 선택되는 핵산 서열을 포함하거나, 필수적으로 이러한 아미노산 서열로 구성되는, 또는 이러한 핵산 서열로 구성되는 게놈 핵산 서열의 상류에서 생물체의 게놈 내로 안정적으로 통합되는 외인성 핵산 서열을 포함할 수 있다.
본 발명에서는 또한, (a) ole 유전자의 핵산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 핵산 서열을 보유하는 생물체를 제공하고, (b) 상기 핵산 서열을 결실 또는 돌연변이시킴으로써 제조된 유전자 조작된 생물체를 제시한다. 가령, 유전자 조작된 생물체는 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 87, 그리고 SEQ ID NO: 135-464 중에서 하나를 인코딩하는 핵산 서열로 구성된 군에서 선택되는 핵산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 핵산 서열을 결실 또는 돌연변이시킴으로써 제조된다. 바람직하게는, 유전자 조작된 생물체는 SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 19, SEQ ID NO: 21과 SEQ ID NO: 87로 구성된 군에서 선택되는 핵산 서열에 적어도 대략 35%(가령, 적어도 대략 45%, 적어도 대략 50%, 적어도 대략 60%, 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 적어도 대략 99%, 또는 적어도 대략 99.5%) 서열 동일성을 갖는 핵산 서열을 결실 또는 돌연변이시킴으로써 제조된다.
바람직한 구체예에서, 유전자 조작된 생물체는 SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 19, SEQ ID NO: 21과 SEQ ID NO: 87로 구성된 군에서 선택되는 핵산 서열을 포함하거나, 이러한 핵산 서열로 필수적으로 구성되는, 또는 이러한 핵산 서열로 구성되는 핵산 서열을 결실 또는 돌연변이시킴으로써 제조된다.
유전자 조작된 생물체는 유전자 조작이 가능한 임의의 생물체일 수 있다. 바람직하게는, 유전자 조작된 생물체는 아내로믹소박터 종(Anaeromyxobacter sp .) Fw109-5, 아스로박터 아우레스켄스(Arthrobacter aurescens), 아스로박터 클로로페놀리쿠스(Arthrobacter chlorophenolicus), 아스로박터 종(Arthrobacter sp .) FB24, 브델로비브리오 박테리오보루스(Bdellovibrio bacteriovorus), 블라스토피렐룰라 마리나(Blastopirellula marina), 브레위박테리움 리넨스(Brevibacterium linens), 버크홀데리아 암비파리아(Burkholderia ambifaria), 버크홀데리아 세노세파시아(Burkholderia cenocepacia), 버크홀데리아 오클라호멘시스(Burkholderia oklahomensis), 멜리오이도시스균(Burkholderia pseudomallei), 버크홀데리아 종(Burkholderia sp .) 383, 칸디다투스 쿠에네니아 스튜가르티엔시스(Candidatus Kuenenia stuttgartiensis), 클로로플렉서스 아그레간스(Chloroflexus aggregans), 클로로플렉서스 아우란티아쿠스(Chloroflexus aurantiacus), 클라비박터 미시가넨시스 아종 미시가넨시스(Clavibacter michiganensis subsp. michiganensis), 클라비박터 미시가넨시스 아종 세페도니쿠스(Clavibacter michiganensis subsp. Sepedonicus), 클로스트리듐 보틀리눔(Clostridium botulinum) A, 클로스트리듐 보틀리눔(Clostridium botulinum) A3, 클로스트리듐 보틀리눔(Clostridium botulinum) Bl, 클로스트리듐 보틀리눔(Clostridium botulinum) Bf, 클로스트리듐 보틀리눔(Clostridium botulinum) F, 클로스트리듐 보틀리눔(Clostridium botulinum), 콜웰리아 사이크레리트래아(Colwellia psychrerythraea), 콘그레기박터 리토랄리스(Congregibacter litoralis), 디설파티바실륨 알케니보란스(Desulfatibacillum alkenivorans), 디설포코커스 올레오보란스(Desulfococcus oleovorans), 디설포탈레아 사이크로필라(Desulfotalea psychrophila), 디설푸로모나스 아세톡시단스(Desulfuromonas acetoxidans), 플라보박테리알레스 박테리움(Flavobacteriales bacterium), 젬마타 옵스쿠리글로버스(Gemmata obscuriglobus), 지오박터 베미드지엔시스(Geobacter bemidjiensis), 지오박터 로블레이(Geobacter lovleyi), 지오박터 종(Geobacter sp .) FRC-32, 지오박터 우라늄레두센스(Geobacter uraniumreducens), 하헬라 제주엔시스(Hahella chejuensis), 잔나스치아 종(Jannaschia sp .) CCS1, 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 렌티스패라 아라네오사(Lentisphaera araneosa), 마리카울리스 마리스(Maricaulis maris), 마리노박터 알기콜라(Marinobacter algicola), 마리노박터 아쿠애올레이(Marinobacter aquaeolei), 미크로코커스 루테우스(Micrococcus luteus), 미크로스킬라 마리나(Microscilla marina), 모리텔라 종(Moritella sp .) PE36, 미코박테리움 아비움(Mycobacterium avium), 미코박테리움 아비움 아종 파라투베르쿨로시스(Mycobacterium avium subsp. paratuberculosis), 미코박테리움 마리눔(Mycobacterium marinum), 미코박테리움 종(Mycobacterium sp .) GP1, 결핵균(Mycobacterium tuberculosis), 미코박테리움 반바알레니(Mycobacterium vanbaalenii), 임질균(Neisseria gonorrhoeae), 노카르디아 파르시니카(Nocardia farcinica), 오피투타세아 박테리움(Opitutaceae bacterium), 오피투투스 테르라(Opitutus terrae), 패니바실루스 종(Paenibacillus sp .) JDR-2, 펠로박터 프로피오니쿠스(Pelobacter propionicus), 포토박테리움 프로푼둠(Photobacterium profundum), 포토박테리움 프로푼둠(Photobacterium profundum), 포토랍두스 루미네센스 아종 라우몬디(Photorhabdus luminescens subsp. laumondii), 플랑크토미세스 마리스(Planctomyces maris), 플레시오시스티스 파시피카(Plesiocystis pacifica), 슈도알테로모나스 아틀란티카(Pseudoalteromonas atlantica), 사이크로모나스 인그라하밀(Psychromonas ingrahamii), 사이크로모나스 종(Psychromonas sp.) CNPT3, 랄스토니아 피케티(Ralstonia pickettii), 로도코커스 로도크로스(Rhodococcus rhodochrous), 로도코커스 종(Rhodococcus sp .), 로도피렐룰라 발티카(Rhodopirellula baltica), 로세오바리우스 누빈히벤스(Roseovarius nubinhibens), 쉬와넬라 아마조넨시스(Shewanella amazonensis), 쉬와넬라 발티카(Shewanella baltica), 쉬와넬라 벤티카(Shewanella benthica), 쉬와넬라 데니트리피칸스(Shewanella denitrificans), 쉬와넬라 프리기디마리나(Shewanella frigidimarina), 쉬와넬라 할리팍센시스(Shewanella halifaxensis), 쉬와넬라 로이히카(Shewanella loihica), 쉬와넬라 오네이덴시스(Shewanella oneidensis), 쉬와넬라 페알레아나(Shewanella pealeana), 쉬와넬라 푸트레파시엔스(Shewanella putrefaciens), 쉬와넬라 세디미니스(Shewanella sediminis), 쉬와넬라 종(Shewanella sp .) ANA-3, 쉬와넬라 종(Shewanella sp .) MR-4, 쉬와넬라 종(Shewanella sp .) MR-7, 쉬와넬라 종(Shewanella sp .) W3-18-1, 쉬와넬라 우디이(Shewanella woodyi), 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 스트렙토미세스 암보파시엔스(Streptomyces ambofaciens), 크산토모나스 악소노포디스(Xanthomonas axonopodis), 크산토모나스 캄페스트리스(Xanthomonas campestris), 크산토모나스 오리재(Xanthomonas oryzae)와 크실렐라 파스티디오사(Xylella fastidiosa)로 구성된 군에서 선택된다.
바람직한 구체예에서, 유전자 조작된 생물체의 게놈 내로 안정적으로 통합된 외인성 핵산 서열은 동일한 조건 하에 외인성 핵산 서열의 도입 이전에 생물체에서 동일한 폴리펩티드의 발현과 비교하여, 게놈 핵산 서열에 의해 인코딩된 폴리펩티드의 발현을 증가시킨다. 바람직하게는, 유전자 조작된 생물체는 동일한 조건 하에 야생형 생물체에서 탄화수소의 생산과 비교하여 증가된 양의 탄화수소를 생산한다.
바람직한 구체예에서, 유전자 조작된 생물체 내에서 핵산 서열의 결실 또는 돌연변이는 동일한 조건 하에 핵산 서열의 결실 또는 돌연변이 이전에 생물체에서 동일한 폴리펩티드의 생산과 비교하여 핵산 서열에 의해 인코딩된 폴리펩티드의 감소된 생산을 결과한다. 바람직하게는, 유전자 조작된 생물체는 케톤을 생산한다. 가령, 유전자 조작된 생물체는 동일한 조건 하에 핵산 서열의 결실 또는 돌연변이 이전에 생물체에서 케톤의 생산과 비교하여 증가된 양의 케톤을 생산할 수 있다.
본 발명에서는 지방족 케톤, 탄화수소, 그리고 이들의 중간물질을 제조하는 방법을 제시한다. 탄소 사슬 길이, 불포화 위치와 가지점이 조작된 산물을 생산하는데 이용될 수 있는 다양한 재조합 생물체가 제시된다. 이들 산물을 제조하는 방법, 그리고 고품질 생물연료와 특수 화학물질을 산출하기 위하여, 이를테면 크래킹(cracking)을 통하여 이들 산물을 더욱 변경하는 방법 역시 제시된다.
지방족 케톤, 탄화수소, 그리고 탄화수소 중간물질은 재조합 생물체에서 다양한 효소를 발현하거나, 또는 다양한 효소의 발현을 약화시킴으로써 특정한 탄소 사슬 특징을 갖도록 조작될 수 있다. 가령, 탄소 사슬 길이는 내인성 티오에스테라아제의 발현을 약화시키면서 재조합 생물체 내에서 다양한 티오에스테라아제를 발현함으로써 제어될 수 있다. 유사하게, 다양한 분지쇄 α-케토산 데카르복실라아제/데히드로게나아제 유전자(가령, bkd 유전자)를 발현함으로써 탄소 사슬 내로 다양한 가지점이 도입될 수 있고, 다양한 유전자를 발현함으로써, 예를 들면, β-케토- ACP-신타아제 유전자(가령, fabB)를 발현함으로써 포화도 역시 제어될 수 있다. 특정한 탄소 사슬 특징을 제공하고 지방산 생합성 경로 생산을 증가시키기 위하여 재조합 생물체에 포함될 수 있는 다양한 변형에 관한 상세한 설명은 국제특허출원공보 WO 2007/136762호에서 제공되는데, 상기 문헌은 본 명세서에 참조로서 전제적으로 편입된다.
본 발명에서는 생물연료를 생산하는 방법을 제시하는데, 상기 방법은 본 발명에 개시된 방법 중 한 가지를 포함한다. 본 명세서에서, “생물연료”라는 용어는 바이오매스로부터 유래된 임의의 연료를 지칭한다. 생물연료는 석유 기초된 연료를 대체할 수 있다. 가령, 생물연료는 수송 연료(transportation fuel)(가령, 가솔린, 디젤, 제트 연료 등), 난방 연료(heating fuel), 그리고 전기-발생 연료(electricity-generating fuel)를 포함한다. 생물연료는 재생가능 에너지 공급원이다. 구체적으로, 생산된 생물연료는 가솔린, 바이오디젤, 또는 제트 연료일 수 있다.
생물학적으로 생산된 탄화수소, 특히, 지방산 생합성 경로를 이용하여 생물학적으로 생산된 탄화수소를 포함하는 생물연료는 재생가능 공급원으로부터 생산된 적이 없고, 따라서 신규한 화합물(compositions of matter)이다. 이들 신규한 연료는 이중 탄소-동위원소 지문(dual carbon-isotopic fingerprinting) 또는 14C 연대측정(dating)에 기초하여, 석유 탄소로부터 유래된 연료와 구별될 수 있다. 부가적으로, 생물근원 탄소(biosourced carbon)의 특정 공급원(가령, 글루코오스 vs. 글리세롤)은 이중 탄소-동위원소 지문(dual carbon-isotopic fingerprinting)에 의해 결정될 수 있다(참조: 미국특허 제7,169,588호, 이는 본 명세서에 참조로서 편입됨).
석유 기초된 연료로부터 생물연료를 구별하는 능력은 판매 중에 이들 물질을 추적하는데 유용하다. 가령, 생물학적으로 기초된 탄소 동위원소 프로필(carbon isotope profile)과 석유에 기초된 탄소 동위원소 프로필을 모두 포함하는 연료 또는 화학물질은 석유에 기초된 물질로만 만들어진 연료와 화학물질로부터 구별될 수 있다. 따라서 본 발명의 물질은 그들의 독특한 탄소 동위원소 프로필에 기초하여 판매 중에 추적될 수 있다.
생물연료는 각 연료에서 안정 탄소 동위원소 비율(13C/12C)을 비교함으로써 석유에 기초된 연료로부터 구별될 수 있다. 소정의 생물학적으로 기초된 물질에서의 13C/12C 비율은 이산화탄소가 고정된 시점에서 대기중 이산화탄소(atmospheric carbon dioxide)에서의 13C/12C 비율의 결과이다. 이는 또한, 정확한 대사 경로(metabolic pathway)를 반영한다. 지역적 편차(regional variation) 역시 발생한다. 석유, C3 식물(잎이 넓은 담배), C4 식물(목초), 그리고 해양 탄산염(marine carbonate)은 13C/12C와 이에 상응하는 δ13C 수치에서 현저한 차이를 보인다. 더 나아가, C3과 C4 식물에서 지질 물질(lipid matter)은 대사 경로의 결과로써, 동일한 식물의 탄수화물 성분으로부터 유래된 물질과 상이하게 분석된다.
측정의 정밀도(precision)에서, 13C는 동위원소 분할 효과(isotopic fractionation effect)로 인하여 상당한 편차를 보이는데, 생물연료의 경우에 광합성 기전(photosynthetic mechanism)에서 가장 현저하다. 식물에서 탄소 동위원소 비율 차이의 주요한 원인은 식물에서 광합성 탄소 대사(photosynthetic carbon metabolism)의 경로, 특히, 일차 카르복실화(primary carboxylation)(즉, 대기중 CO2의 최초 고정) 동안 발생하는 반응에서 차이와 밀접하게 연관된다. 2가지 대분류의 식물(vegetation)은 "C3"[또는 캘빈-벤슨(Calvin-Benson)] 광합성 주기(photosynthetic cycle)를 통합하는 식물과 "C4"[또는 해치-슬랙(Hatch-Slack)] 광합성 주기를 통합하는 식물이다.
C3 식물에서, 일차 CO2 고정 또는 카르복실화 반응에는 효소 리불로오스(ribulose)-1,5-디포스페이트(diphosphate) 카르복실라아제가 관여하고, 첫 번째 안정한 산물은 3-탄소 화합물이다. C3 식물, 예를 들면, 활엽수(hardwood)와 침엽수(conifer)는 온대 기후 지역(temperate climate zone)에서 우세하다.
C4 식물에서 일차 카르복실화 반응은 다른 효소, 포스포에놀-피루베이트 카르복실라아제가 관여하는 부가적 카르복실화 반응이다. 첫 번째 안정한 탄소 화합물은 4-탄소 산인데, 이는 차후에 탈카르복실화된다. 이렇게 방출된 CO2는 C3 주기에 의해 재고정된다. C4 식물의 실례는 난지형 목초(tropical grass), 옥수수와 사탕수수이다.
C4와 C3 식물 둘 모두 일정한 범위의 13C/12C 동위원소 비울(isotopic ratio)을 보이긴 하지만, 전형적인 수치는 C4 식물의 경우에 mil당(per mil) 대략 -7 내지 대략 -13, 그리고 C3 식물의 경우에 mil당 대략 -19 내지 대략 -27이다[예로써, Stuiver et al., Radiocarbon, 19: 355 (1977) 참조]. 석탄과 석유는 일반적으로, 후자 범위에 속한다. 13C 측정 척도(measurement scale)는 초기에, Pee Dee Belemnite(PDB) 석회암(limestone)에 의해 제로 세트(zero set)로 정의되었는데, 여기서 수치는 상기 물질로부터 천분율(parts per thousand) 편차로 표시된다. “δ13C” 수치는 약자 ‰로 표시되는 천분율(mil당)이고, 아래와 같이 계산된다:
δ13C(‰) = [(13C/12C)시료 - (13C/12C)표준]/(13C/12C)표준 x 1000
PDB 참고 물질(RM)이 고갈되고 있기 때문에, IAEA, USGS, NIST, 그리고 다른 선택된 국제 동위원소 연구소와 협력하여 일련의 대안적 RM이 개발되고 있다. PDB로부터 mil당 편차에 대한 표시법은 δ13C이다. 측정은 질량 44, 45와 46의 분자 이온(molecular ion)에서 높은 정밀도 안정 비율 질량 분석(high precision stable ratio mass spectrometry, IRMS)에 의해 CO2에서 수행된다.
본 발명에서는 본 발명에 개시된 임의의 방법에 의해 생산된 탄화수소 또는 생물연료를 제시한다. 구체적으로, 탄화수소 또는 생물연료는 대략 -28 또는 그 이상, 대략 -27 또는 그 이상, -20 또는 그 이상, -18 또는 그 이상, -15 또는 그 이상, -13 또는 그 이상, -10 또는 그 이상, 그리고 -8 또는 그 이상의 δ13C를 가질 수 있다. 가령, 탄화수소는 대략 -30 내지 대략 -15, 대략 -27 내지 대략 -19, 대략 -25 내지 대략 -21, 대략 -15 내지 대략 -5, 대략 -13 내지 대략 -7, 대략 -13 내지 대략 -10의 δ13C를 가질 수 있다. 본 발명에서는 또한, 대략 -10, -11, -12, 또는 -12.3의 δ13C를 갖는 탄화수소 또는 생물연료를 제시한다.
생물연료는 또한, 각 연료에서 14C의 양을 비교함으로써 석유 기초된 연료로부터 구별될 수 있다. 14C가 5730년의 핵 반감기(nuclear half life)를 갖기 때문에, “더욱 오래된” 탄소를 내포하는 석유 기초된 연료는 “더욱 새로운”탄소를 내포하는 생물연료와 구별될 수 있다[예로써, Currie, "Source Apportionment of Atmospheric Particles," Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series (Lewis Publishers, Inc) (1992) 3-74 참조].
방사성탄소 연대측정(radiocarbon dating)에서 기본 가정은 대기에서 14C 농도의 불변(constancy)이 생존 생물체에서 14C의 불변으로 이어진다는 것이다. 하지만, 1950년 이후로 대기 핵 실험(atmospheric nuclear testing)과 1850년 이후로 화석 연료의 연소로 인하여, 14C는 2차 지구화학적 시간 특징(geochemical time characteristic)을 획득하였다. 대기중 CO2에서와 이에 따른, 살아있는 생물권(biosphere)에서 이의 농도는 1960년대 중반, 핵 실험의 피크 시점에 거의 2배에 육박하였다. 이후, 대략 1.2 x 10-12의 항정 상태(steady-state) 우주기원(대기) 기준 동위원소 비율(14C/12C)로 점진적으로 되돌아가고 있고, 근사의 이완 “반감기”(approximate relaxation half-life)가 7-10년이다. [이러한 후자 반감기는 문자 그래도 해석되어서는 안 된다; 오히려, 핵 시대의 도래 이후로 대기와 생물권 14C의 편차를 추적하는 상세한 대기 핵 입력/붕괴 함수(atmospheric nuclear input/decay function)가 이용되어야 한다].
이러한 후자 생물권 14C 시간 특징은 최근의 생물권 탄소의 연대 측정(annual dating)의 장래성을 제공한다. 14C는 가속기 질량 분석(Accelerator Mass Spectrometry, AMS)에 의해 측정될 수 있고, 결과는 “현대 탄소의 분율”(fM) 단위로 표시된다. fM은 National Institute of Standards and Technology(NIST) 표준 참고 물질(SRMs) 4990B와 4990C에 의해 정의된다. 본 명세서에서, “현대 탄소의 분율” 또는 “fM”은 각각, 옥살산(oxalic acid) 표준 HOxI와 HOxII로 알려져 있는, National Institute of Standards and Technology(NIST) 표준 참고 물질(SRMs) 4990B와 4990C에 의해 정의된 의미와 동일한 의미를 갖는다. 이러한 기본 정의는 0.95배 14C/12C 동위원소 비율 HOxI(AD 1950로 참조됨)에 관계한다. 이는 붕괴-보정된(decay-corrected) 산업혁명전 목재에 거의 동등하다. 현재의 살아있는 생물권(식물 물질)의 경우에, fM은 대략 1.1이다.
본 발명에서는 적어도 대략 1의 fM 14C를 가질 수 있는 탄화수소 또는 생물연료를 제시한다. 가령, 이러한 탄화수소 또는 생물연료는 적어도 대략 1.01의 fM 14C, 대략 1 내지 대략 1.5의 fM 14C, 대략 1.04 내지 대략 1.18의 fM 14C, 또는 대략 1.111 내지 대략 1.124의 fM 14C를 가질 수 있다.
14C의 다른 척도는 현대 탄소 비율(pMC)로 알려져 있다. 14C 연대를 이용하는 고고학자와 지질학자에게, AD 1950은 “0년(zero year)”에 해당한다. 이는 또한, 100 pMC를 나타낸다. 대기에서 “폭탄 탄소”는 열핵무기의 피크 시점인 1963년에 정상 수준의 거의 2배에 육박하였다. 대기 내에서 폭탄 탄소의 분포는 출현 이후로 거의 동일하였고, AD 1950 이후로 생존하는 식물과 동물의 경우에 100 pMC 초과의 수치를 보인다. 이는 시간의 흐름에 따라서 점진적으로 감소하고 있는데, 현재 수치는 거의 107.5 pMC이다. 이는 새로운 바이오매스 물질, 예를 들면, 옥수수가 107.5 pMC에 근접하는 14C 시그너처(signature)를 갖는다는 것을 의미한다. 석유 기초된 화합물은 0의 pMC 수치를 가질 것이다. 화석 탄소를 현재의 탄소와 병합하면, 현재의 pMC 함량이 희석될 것이다. 107.5 pMC가 현재의 바이오매스 물질의 14C 함량을 나타내고 0 pMC가 석유 기초된 산물의 14C 함량을 나타낸다고 가정하면, 상기 물질에 대한 측정된 pMC 수치는 이들 2가지 성분 유형(component type)의 비율을 반영할 것이다. 가령, 현재의 콩으로부터 100% 유래된 물질은 107.5 pMC에 근접하는 방사성탄소 시그너처(radiocarbon signature)를 제공할 것이다. 상기 물질이 석유 기초된 산물로 50% 희석되면, 이는 대략 54 pMC의 방사성탄소 시그너처를 제공할 것이다.
생물학적으로 기초된 탄소 함량은 100%가 107.5 pMC에 상당하고 0%가 0 pMC에 상당한 것으로 지정함으로써 도출된다. 가령, 99 pMC로 측정된 시료는 93%에 상당하는 생물학적으로 기초된 탄소 함량을 제공할 것이다. 분석된 물질 내에서 모든 성분이 현재의 생물학적 물질 또는 석유 기초된 물질로부터 기원한다는 가정 하에, 이러한 수치는 평균 생물학적으로 기초된 탄소 결과로서 지칭된다.
본 발명에서는 적어도 대략 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99, 또는 100의 pMC를 가질 수 있는 탄화수소 또는 생물연료를 제시한다. 본 발명에서는 또한, 대략 50 내지 대략 100, 대략 60 내지 대략 100, 대략 70 내지 대략 100, 대략 80 내지 대략 100, 대략 85 내지 대략 100, 대략 87 내지 대략 98, 그리고 대략 90 내지 대략 95의 pMC를 갖는 탄화수소 또는 생물연료를 제시한다. 본 발명에서는 또한, 대략 90, 91, 92, 93, 94, 또는 94.2의 pMC를 갖는 탄화수소 또는 생물연료를 제시한다.
탄화수소는 올레핀일 수 있다. 올레핀은 단일불포화 또는 다중불포화(가령, 이중불포화, 삼중불포화 등)될 수 있다. 올레핀은 대략 10개 내지 대략 40개 탄소의 탄소 사슬 길이를 가질 수 있다. 가령, 올레핀은 대략 15개 내지 대략 35개, 대략 17개 내지 대략 34개, 대략 18개 내지 대략 33개, 대략 19개 내지 대략 33개, 대략 27개 내지 대략 33개, 대략 29개 내지 대략 31개, 또는 대략 27개, 28개, 29개, 30개, 31개, 32개, 또는 33개 탄화수소의 탄소 사슬 길이를 가질 수 있다. 탄화수소는 직쇄 탄화수소 또는 분지쇄 탄화수소일 수 있다. 탄화수소는 환형 모이어티를 포함할 수 있다.
본 발명에서는 본 발명에 개시된 탄화수소를 포함하는 생물연료를 제시한다. 이러한 생물연료는 가솔린, 바이오디젤, 또는 제트 연료일 수 있다. 이러한 생물연료는 탄소 공급원으로부터 유래될 수 있다. 본 명세서에서, “탄소 공급원”이라는 용어는 원핵 또는 단순한 진핵 세포 성장을 위한 탄소 공급원으로서 이용하기 적합한 기질 또는 화합물을 지칭한다. 탄소 공급원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드, 그리고 가스(가령, CO와 CO2)가 포함되지만 이들에 국한되지 않는 다양한 형태로 존재할 수 있다. 이들에는 예로써, 다양한 모노사카라이드(monosaccharide), 예를 들면, 글루코오스(glucose), 프럭토오스(fructose), 만노오스(mannose)와 갈락토오스(galactose); 올리고사카라이드(oligosaccharide), 이를테면, 프럭토-올리고사카라이드(fructo-oligosaccharide)와 갈락토-올리고사카라이드(galacto-oligosaccharide); 폴리사카라이드(polysaccharide), 예를 들면, 자일로스(xylose)와 아라비노스(arabinose); 디사카라이드(disaccharide), 이를테면, 수크로오스(sucrose), 말토오스(maltose)와 투라노오스(turanose); 셀룰로오스 물질(cellulosic material), 이를테면, 메틸셀룰로오스(methyl cellulose)와 나트륨 카르복시메틸 셀룰로오스(sodium carboxymethyl cellulose); 포화된 또는 불포화된 지방산 에스테르, 이를테면, 숙시네이트(succinate), 락테이트(lactate)와 아세테이트(acetate); 알코올(alcohol), 이를테면, 에탄올(ethanol) 또는 이들의 혼합물이 포함된다. 탄소 공급원은 또한, 글루코오스가 포함되지만 이에 국한되지 않는, 광합성(photosynthesis)의 산물일 수 있다.
바람직한 탄소 공급원은 바이오매스(biomass)이다. 본 명세서에서, “바이오매스”라는 용어는 생물학적 물질로부터 유래된 탄소 공급원을 지칭한다. 바이오매스는 생물연료로 변환될 수 있다. 바이오매스의 전형적인 공급원의 하나는 식물 물질(plant matter)이다. 가령, 옥수수(corn), 사탕수수(sugar cane), 또는 지팽이풀(switchgrass)이 바이오매스로서 이용될 수 있다. 바이오매스의 다른 무제한적 실례는 동물 물질(animal matter), 예를 들면, 축산 분뇨(cow manure)이다. 바이오매스에는 또한, 산업(industry), 농업(agriculture), 임업(forestry), 그리고 가정(household)으로부터 폐기물(waste product)이 포함된다. 바이오매스로서 이용될 수 있는 이런 폐기물의 실례는 발효 폐액(fermentation waste), 짚(straw), 재목(lumber), 하수 오물(sewage), 음식 찌꺼기(garbage), 그리고 남은 음식물(food leftover)이다. 바이오매스에는 또한, 탄소 공급원, 이를테면, 탄수화물[가령, 모노사카라이드(monosaccharide), 디사카라이드(disaccharide), 또는 폴리사카라이드(polysaccharide)]이 포함된다. 다른 바람직한 탄소 공급원은 글루코오스이다. 바람직하게는, 탄소 공급원은 재생가능 에너지 공급원이다. 이러한 재생가능 에너지 공급원은 바이오매스일 수 있다.
[실시예]
아래의 실시예는 본 발명을 더욱 예시하지만, 이의 범위를 결코 한정하지 않는다.
실시예 1
본 실시예에서는 본 특허에서 실시예를 수행하는데 이용되는 재료와 방법을 기술한다. 특정 방법이 기술되긴 하지만, 당업자는 다른 유사한 방법 역시 이용될 수 있음을 이해할 것이다. 일반적으로, 달리 명시되지 않는 경우에, 표준 실험실 규정(standard laboratory practice)이 이용되었다. 가령, 클로닝(cloning); 핵산의 조작(manipulation)과 염기서열분석(sequencing); 단백질의 정제(purification)와 분석(analysis); 그리고 다른 분자생물학적 기술과 생화학적 기술에 대하여 표준 실험실 규정이 이용되었다. 이들 기술은 표준 실험실 매뉴얼(standard laboratory manual), 예를 들면, Sambrook et al.,(상기)과 Ausubel et al.,(상기)에서 상세하게 설명된다.
게놈 서열: 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia)의 전체 게놈 서열은 2가지 상이한 균주에 대하여 공개적으로 가용하다. 스테노트로포모나스 말토필리아(S. maltophilia) R551-3의 전체 게놈 서열은 http://genome.ornl.gov/microbial/smal/에서 확인할 수 있다(2007년 5월 16일에 최종적으로 액세스됨). 스테노트로포모나스 말토필리아(S. maltophilia) K279a의 전체 게놈 서열은 http://www.sanger.ac.uk/Projects/S_maltophilia/에서 확인할 수 있다(2007년 5월 16일에 최종적으로 액세스됨). 본 발명에 개시된 단백질을 인코딩하는 핵산 서열은 양쪽 염기서열분석된 게놈에서 확인되고 ATCC 17679로부터 스테노트로포모나스 말토필리아(S. maltophilia) 균주로부터 실험적으로 확증되었다. 이에 더하여, 이들 단백질 활성 중의 일부가 본 발명에 개시된 바와 같은 핵산 서열과 코돈 최적화된 핵산 서열을 이용하여, 대장균(E. coli), 바실루스 서브틸리스(B. subtilis), 바실루스 메가테리움(B. megaterium), 그리고 사카로미세스 세레비시아(S. cerevisiae)에서 확증되었다.
미생물 균주: 본 발명에서 이용된 미생물 균주는 아래와 같다:
스테노트로포모나스 말토필리아(S. maltophilia)(ATCC 균주 번호: 17674, 17679, 17445, 17666);
스테노트로포모나스 말토필리아(S. maltophilia) ATCC 17679 △oleA
스테노트로포모나스 말토필리아(S. maltophilia) ATCC 17679 △oleC
스테노트로포모나스 말토필리아(S. maltophilia) ATCC 17679 △oleD
대장균(E. coli) T7 Express lysY/Iq(New England Biolabs, Ipswich, MA 01938-2723)
대장균(E. coli) C41(DE3)(Lucigen Corporation, Middleton, WI 53562)
대장균(E. coli) C41(DE3) △fadE(fadE 유전자 EC 1.3.99.3, 아실-CoA 데히드로게나아제의 결실을 보유하는 Lucigen Corporation, Middleton, WI 53562로부터 대장균(E. coli) C41(DE3) 균주, Klein. K. et al., Eur . J. Biochem. II I 19: 442-450 (1971)).
대장균(E. coli) C41(DE3) △fadE; pET-21b(+)_OleA, pCOLADuet-1_OleC, pCDFDuet-1_OleD
대장균(E. coli) C41(DE3); pET-21b(+)_OleA
대장균(E. coli) C41(DE3); pET-21b(+)_OleB
대장균(E. coli) C41(DE3); pET-21b(+)_OleD
대장균(E. coli) C41(DE3); pETDuet-1 OleAB; pCOLADuet-1_OleCD
대장균(E. coli) MG1655 △fadE(fadE 유전자의 결실을 보유하는 대장균(E. coli) MG1655)
대장균(E. coli) MG1655 △fadE, fadD (+)(fadE 유전자와 fadD의 상류에 T5 프로모터 서열의 결실을 보유하는 대장균(E. coli) MG1655 균주)
사카로미세스 세레비시아(Saccharomyces cerevisiae), Hansen, teleomorph BY4741(ATCC 201388)
사카로미세스 세레비시아(S. cerevisiae) BY4741; pESC-HIS_OleA
바실루스 메가테리움(Bacillus megaterium) WH320(Mo Bi Tec(Germany)로부터 균주)
바실루스 메가테리움(B. megaterium) WH320; pWH1520_OleCDAB
바실루스 메가테리움(B. megaterium) WH320; pWH1520
바실루스 서브틸리스(Bacillus subtilis) IHA01 lacA ::spec leuB8 metB5 r(-)m(+) Sp(Bacillus Genetic Stock Center(Columbus)로부터 균주, OH 균주 번호 BGSC 1A785)
바실루스 서브틸리스(B. subtilis) IHA01, pHT01_OleA
아스로박터 아우레스켄스(Arthrobacter aurescens) TC1(ATCC BAA-1386으로부터 균주)
내성 마커: AmpR, 암피실린/카베니실린(100 ㎍/㎖); KanR, 카나마이신(30 ㎍/㎖); CamR, 클로람페니콜(34 ㎍/㎖); SmR, 스트렙토마이신/스펙티노마이신(50 ㎍/㎖); 테트라사이클린[15 ㎍/㎖ 대장균(E. coli), 바실루스 메가테리움(B. megaterium), 50 ㎍/㎖ 스테노트로포모나스 말토필리아(S. maltophilia)] 내성 마커가 본 명세서에 기술된 실시예에서 이용되었다.
중합효소 연쇄 반응( PCR ): 본 발명에 개시된 다수의 발현 구조체를 산출하기 위하여 DNA로부터 특정의 핵산 서열을 증폭하는데 PCR이 이용되었다. 본 명세서에 기술된 PCR 반응에 이용된 프라이머는 표 14에 열거된다. 플라스미드는 표 15에 열거된다.
클로닝 방법: 표 15에 기술된 벡터 내로 DNA를 클로닝하기 위하여 표준 분자생물학 클로닝 절차가 이용되었다(예로써, Sambrook et al., 상기 참조). 제한 효소 AatII, AflII, AvrII, BamHI, BglII, HindIII, NcoI, NdeI, NheI, NruI, PciI, ScaI, SfoI, SpeI, XbaI, XhoI, 그리고 ZraI는 New England Biolabs(Ipswich, MA 01938)로부터 구입하였다.
발현 프로토콜: 산물의 발현 또는 생산을 조사하기 위하여 다양한 규모의 발효를 수행하였다. 이들 프로토콜은 하기에 기술되고 각 실시예에서 5 ㎖ 발효, 25 ㎖ 발효로서 지칭되거나, 또는 대안적 발효 기술이 기술된다.
5 ㎖ 발효: 이들 발효는 5 ㎖의 Luria Broth Miller(LB)(EMD, Chemicals, Inc., San Diego, CA)를 포함하는 15 ㎖ 검사 튜브에서 수행하였다. 배양액은 0.1 내지 1의 OD6OO까지 성장시키고 1 mM의 최종 농도에서 IPTG로 유도하였다. 이들 배양액은 실험에 따라서, 유도후 6시간 내지 48시간에서 임의의 시점에 추출하였다. 발효물은 교반하면서 25℃, 30℃, 또는 37℃에서 배양하였다.
25 ㎖ 발효: 이들 발효는 25 ㎖ 최종 부피의 배지를 포함하는 125 ㎖ 플라스크에서 수행하였다. 접종 배양액(seed culture)은 15 ㎖ 검사 튜브 내에서 5 ㎖의 LB 배지를 냉동 원액(freezer stock)의 긁음(scraping)으로부터의 세포로 접종함으로써 준비하였다. 냉동 원액은 LB 배지에서 20%의 최종 농도로 글리세롤(glycerol)을 첨가하고, 배양액을 -8O℃에서 저장하여 만들었다. 접종 배양액은 상기 배양액의 OD600이 0.15 내지 0.6에 도달할 때까지 37℃에서 교반하면서 배양하였다. 배양액은 이후, 발효물을 접종하는데 이용하였다. 2% 글루코오스를 포함하는 22 ㎖의 M9 배지(6 g/ℓ Na2HPO4, 3 g/ℓ KH2PO4, 0.5 g/ℓ NaCl, 1 g/ℓ NH4Cl, 1 ㎎/ℓ 티아민(thiamine), 1 mM MgSO4, 0.1 mM CaCl2)는 0.15 OD600 단위(unit)의 세포 밀도(cell density)로 2 ㎖의 LB 배지로 접종하였다. 배양액은 이후, OD600이 0.3 내지 0.6 단위가 될 때까지 교반하면서 배양하고, 이 시점에서 배양액은 1 mM의 최종 농도로 IPTG로 유도하였다. 지방산이 공급되는 실험에서, 이들은 배양액이 유도되는 시점과 동일한 시점에 첨가하였다. 배양액은 실험에 따라서, 유도후 2시간 내지 48시간에서 임의의 시점에 추출하였다. 발효물은 교반하면서 25℃, 30℃, 또는 37℃에서 배양하였다.
세포 용해질 프로토콜: 표준 세포 용해 프로토콜이 이용되었다. 간단히 말하면, 세포는 초음파처리(sonication)로 및/또는 BugBuster®plus Benzonase®뉴클레아제 반응물 키트(Catalog #70750 Novagen; EMD Chemicals, Inc., San Diego, CA)의 이용으로 파괴하였다. 가령, 10 ㎖ 배양액은 3500 rpm에서 15분 동안 원심분리(회전자 SX-4750A가 구비된 Allegra X-15R 원심분리기, Beckman Coulter, Fullerton, CA)하고, 생성된 펠릿(pellet)은 2 ㎖의 BugBuster®과 2 ㎕의 Benzonase®뉴클레아제에서 재현탁시켰다.
단백질 정제 프로토콜: His-표식된 단백질은 표준 절차를 이용하여 정제하였다. 단백질은 User 프로토콜 TB054 Rev. F0106(Novagen; EMD Chemicals, Inc., San Diego, CA)에서 확인된 사용설명서에 따라 정제하였다.
탄화수소 추출 방법:
추출 방법 1: 5 ㎖ 펠릿 추출
유기 화합물(올레핀, 지방족 케톤, 그리고 탄화수소)은 메탄올:헥산 추출 프로토콜을 이용하여 세균 세포 펠릿으로부터 추출되었다. 간단히 말하면, 5 ㎖의 배양/발효 액체배지는 유리 검사 튜브 내에서 3500 rpm에서 15분 동안 원심분리(회전자 SX-4750A가 구비된 Allegra X-15R 원심분리기, Beckman Coulter, Fullerton, CA)하고, 상층액은 따라버리고, 생성된 펠릿은 100 ㎕의 무균 증류수(sterile distilled water)에서 재현탁시키고 균질해질 때까지 와동 혼합기(vortex mixer)에서 혼합하였다. 그 다음, 1 ㎖의 메탄올을 첨가하고, 와동 혼합기를 이용하여 시료를 혼합하였다. 시료는 이후, 초음파처리 수조(sonicating water bath)(Bransonic®, Tabletop Ultrasonic Cleaners, model 5510, Danbury, CT)에서 15분 내지 1.5시간 동안 초음파처리하였다. 초음파처리 이후에, 4 ㎖의 헥산을 첨가하고 와동 혼합기에서 시료를 혼합하였다. 시료는 이후, 3500 rpm에서 15분 동안 원심분리(회전자 SX-4750A가 구비된 Allegra X-15R 원심분리기, Beckman Coulter, Fullerton, CA)하였다. 상층(헥산 층)은 이전하고 깨끗한 유리 튜브에 첨가하였다. 시료는 이후, 용매가 실질적으로 존재하지 않을 때까지 대략 30분 동안 진공 하에 원심분리기(Vacufuge 5301, Eppendorf, Westbury, NY)에서 건조시켰다. 시료는 이후, 100 ㎕의 에틸 아세테이트 또는 클로로포름에 재현탁시켰다. 그 다음, 1 ㎕의 시료를 하기에 기술된 검출 방법에 따라 GC/MS에서 분석하였다.
추출 방법 2: 시험관내 분석을 위한 방법
시험관내 분석을 위하여, 유기 화합물(올레핀, 지방족 케톤, 그리고 탄화수소)은 에틸 아세테이트/1% 아세트산 추출 프로토콜을 이용하여 시험관내 시료로부터 추출하였다. 시험관내 분석 시료는 1% 아세트산을 내포하는 500 ㎕의 에틸 아세테이트의 부가로 추출하였다. 시료는 와동 혼합기에서 혼합하고, 이후 수층(aqueous layer)과 유기층(organic layer)을 분리하기 위하여 3500 rpm에서 5분 동안 원심분리(회전자 FA-45-24-11이 구비된 원심분리기 5424, Eppendorf, Westbury, NY)하였다. 상층(에틸 아세테이트 층)은 깨끗한 튜브로 이동시켰다. 시료는 이후, 용매가 실질적으로 존재하지 않을 때까지 대략 30분 동안 진공 하에 원심분리기(Vacufuge 5301, Eppendorf, Westbury, NY)에서 건조시켰다. 시료는 50 ㎕의 에틸 아세테이트에 재현탁시키고 GC/MS 및/또는 GC/FID로 분석하였다. 하기에 기술된 검출 방법에 따라서, 1 내지 10 ㎕를 GC/MS 또는 GC/FID에서 탄화수소 함량에 대하여 분석하였다.
추출 방법 3: 소규모 전체 세포 배양액 추출
0.5 내지 1 ㎖의 상기 발효 발효액을 1.7 ㎖ Eppendorf 튜브에 첨가하였다. 상기 배양액은 이후, 적절한 탄화수소 스파이크(spike)(가령, 올레핀의 경우에 10 ㎎/ℓ cis-9-트리코센(tricosene) 또는 10 ㎎/ℓ 헥사코세인, 지방족 케톤의 경우에 10 ㎎/ℓ 14-헵타코사논 등)를 내포하는 0.25 내지 0.5 ㎖의 에틸 아세테이트로 추출하였다. 배양액-에틸 아세테이트 혼합물은 와동 혼합기에서 10분 동안 높은 속도로 혼합하였다. 시료는 이후, 13,000 rpm에서 5분 동안 Eppendorf 원심분리기(회전자 FA-45-24-11이 구비된 원심분리기 5424, Eppendorf, Westbury, NY)에서 원심분리하였다. 유기 층(상층)은 하기에 기술된 GC/MS 또는 GC/FID 검출 방법을 이용한 분석을 위하여 이전하였다.
탄화수소 검출 방법:
검출 방법 1: 20분간 GC/MS
GC/MS 검출을 위하여, 아래의 프로토콜을 이용하여 탄화수소와 지방족 케톤을 관찰하고 검증하였다:
작업 시간(run time): 20분
칼럼: HP-5-MS(5% 디페닐 실록산, 95% 디메틸 실록산) Part No. 19091S-433E, 길이: 30(meter), 내부 직경: 0.25(㎜) narrowbore, 필름: 0.25(μM)
MSD 스캔 범위(scan range): 50 - 800 M/Z
주입: 1 ㎕ Agilent 6850 주입기(inlet)
주입기: 300℃ 비분할(splitless)
담체 가스: 헬륨
오븐 온도: 100℃에서 5분간 유지; 32O℃까지 25℃/min; 320℃에서 5분간 유지
검출기: Agilent 5975B VL MSD
검출기 온도: 300℃
검출 방법 2: 5분간 GC/MS
GC/MS 검출을 위하여, 아래의 프로토콜을 이용하여 탄화수소와 지방족 케톤을 검출하고 검증하였다:
작업 시간: 4.9분
칼럼: HP-5-MS(5% 디페닐 실록산, 95% 디메틸 실록산) Part No. 19091 S-433E,
길이: 30(meter), 내부 직경: 0.25(㎜) narrowbore, 필름: 0.25(μM)
MSD 스캔 범위: 50 - 140 M/Z
주입: 1 ㎕ Agilent 6850 주입기
주입기: 300℃ 비분할
담체 가스: 헬륨
오븐 온도: 225℃에서 유지되지 않음; 320℃까지 25℃/min; 320℃에서 1.1분간 유지
검출기: Agilent 5975B VL MSD
검출기 온도: 300℃
검출 방법 3: GC/FID
GC/FID 검출을 위하여, 아래의 프로토콜을 이용하여 탄화수소와 지방족 케톤을 검출하고 검증하였다:
작업 시간: 목적 탄화수소의 길이에 따라서 2.75분 내지 4분. 탄화수소가 길수록 더욱 긴 시간이 이용된다.
칼럼: Thermo Electron Corporation: (Part No. UFMC 002 000 000 00): Ph5, 필름 두께 0.4 ㎜,
길이: 5(meter),
내부 직경: 0.1 ㎜,
주입된 시료 체적(sample volume): 실험에 따라서 1 내지 10 ㎕
주입기: 비분할
담체 가스: 헬륨
오븐 온도: 100℃에서 1분간 유지; 350℃까지 200℃/min; 350℃에서 0.50분간 유지
검출기: Thermo FID 검출기
검출 방법 4: 5.8분간 GC/MS
GC/MS 검출을 위하여, 아래의 프로토콜을 이용하여 탄화수소와 지방족 케톤을 검출하고 검증하였다:
작업 시간: 5.83분
칼럼: DB-1HT(100% 디메틸폴리실록산) Part No. 122-1111(Agilent Technologies, Inc), 길이: 15(meter), 내부 직경: 0.25(㎜) narrowbore, 필름: 0.1(μM)
MSD 스캔 범위: 50 - 550 m/z
주입: 1 ㎕ Agilent 6890 N 주입기
주입기: 300℃ 비분할
담체 가스: 헬륨[유속(flow rate): 1.3 ㎖/min]
오븐 온도: 16O℃에서 0.3분간 유지; 32O℃까지 30℃/min; 320℃에서 0.2분간 유지
검출기: Agilent 5975B XL EI/CI MSD
검출기 온도: 25O℃
플라스미드 작제 (construction): 대장균(E. coli), 바실루스 서브틸리스(B. subtilis), 바실루스 메가테리움(B. megaterium)과 사카로미세스 세레비시아(S. cerevisiae)를 비롯한 관심 세포에서 oleA, oleB, oleC와 oleD의 발현을 위하여 다수의 플라스미드를 작제하였다. 이들 구조체는 개별 유전자를 내포하는 플라스미드와 오페론 내에 유전자의 조합을 내포하는 플라스미드로 구분될 수 있다.
개별 유전자 oleA , oleB , oleC 와 oleD 를 내포하는 플라스미드: oleA, oleB, oleC와 oleD에 대한 유전자 서열은 이들 유전자 서열을 내포하는 숙주 균주의 게놈 DNA로부터 PCR 증폭에 의해, 또는 계약에 근거한 합성 유전자의 설계와 생산(DNA2.0 Inc., Menlo Park, CA 94025)에 의해 획득되었다. 간단히 말하면, oleA, oleB, oleC와 oleD는 아래와 같이, 스테노트로포모나스 말토필리아(S. maltophilia) ATCC 17679로부터 분리된 게놈 DNA로부터 증폭하였다: oleA(SEQ ID NO: 1)는 프라이머 LB118(SEQ ID NO: 29)과 LB119(SEQ ID NO: 30)를 이용하여 증폭하였다; oleB(SEQ ID NO: 9)는 프라이머 LB151(SEQ ID NO: 35)과 LB152(SEQ ID NO: 36)를 이용하여 증폭하였다; oleC(SEQ ID NO: 5)는 프라이머 LB155(SEQ ID NO: 31)와 LB159(SEQ ID NO: 32)를 이용하여 증폭하였다; oleD(SEQ ID NO: 7)는 프라이머 LB157(SEQ ID NO: 33)과 LB158(SEQ ID NO: 34)을 이용하여 증폭하였다. oleA(SEQ ID NO: 1), oleB(SEQ ID NO: 9), oleC(SEQ ID NO: 5)와 oleD(SEQ ID NO: 7) 증폭 산물은 제한 효소 NdeI과 XhoI를 이용하여 pET-21b(+), pCDFDuet-1, pCOLADuet-1, pETDuet-1, 또는 pACYCDuet-1 내로 삽입하였다. 정확한 플라스미드 클론은 생성된 형질전환체로부터 선별하고 DNA 절단과 염기서열분석으로 확증하였다. 유사한 클로닝 방법을 이용하여 oleA(SEQ ID NO: 1), oleB(SEQ ID NO: 9), oleC(SEQ ID NO: 5)와 oleD(SEQ ID NO: 7)를 임의의 관심 벡터 내로 삽입할 수 있다.
플라스미드 pCL1920pTrcOleA는 앞서 기술된 바와 같은 표준 클로닝 기술을 이용하여, 스테노트로포모나스 말토필리아(S. maltophilia) ATCC 17679로부터 고유 oleA DNA 서열을 내포하는 pET21b(+)_OleA 플라스미드로부터 oleA 뉴클레오티드 서열을 세균 발현 벡터 pCL1920pTrc 내로 클로닝함으로써 작제하였다. 벡터 골격 pCL1920pTrc(SEQ ID NO: 24)는 LS9, Inc에서 작제되었다. 간단히 말하면, lacIq 서열, pTrc 프로모터, 그리고 복수의 클로닝 부위를 내포하는 PCR 산물은 플라스미드 pTrcHis2A(Invitrogen, Carlsbad, CA) DNA로부터 LF302(SEQ ID NO: 76)와 LF303(SEQ ID NO: 77)을 이용하여 증폭하였다. 생성된 PCR 산물은 AflII와 ZraI로 절단하고, AflII와 SfoI로 절단된 플라스미드 pCL1920(NCCBNr3176 Nucl . Acids Res., 18: 4631, (1990)) 내로 표준 DNA 결찰로 클로닝하였다. 생성된 클론은 잘못된 방향으로 상기 삽입체(insert)를 내포하였고, AflII 제한 부위가 보존되지 않았다. 이렇게 생성된 플라스미드는 pCL1920pTrc(SEQ ID NO: 24)로 명명되었다.
플라스미드 pCL1920pTrcOleA를 작제(construct)하기 위하여, oleA(SEQ ID NO: 1)는 프라이머 LB189(SEQ ID NO: 45)와 LF304(SEQ ID NO: 44)를 이용하여 PCR 증폭하였다. OleA 증폭 산물은 제한 효소 PciI와 XhoI를 이용하여 pCL1920pTrc 내로 클로닝하여 플라스미드 pCL1920pTrcOleA를 산출하였다.
바실루스 서브틸리스(B. subtilis) 내에서 oleA의 발현을 위한 플라스미드 pHT01_OleA를 작제하기 위하여, oleA(SEQ ID NO:3)는 대장균(E. coli) 내에서 발현을 위하여 코돈 최적화된, 스테노트로포모나스 말토필리아(S. maltophilia)로부터 아미노산 서열에 기초된 뉴클레오티드 서열을 내포하는 DNA 주형 pCL1920pTrcOleCDAB로부터 프라이머 LB388(SEQ ID NO: 491)과 LB386(SEQ ID NO: 490)을 이용하여 PCR 증폭하였다. OleA 증폭 산물은 제한 효소 BamHI와 XbaI를 이용하여 pHT01 내로 클로닝하여 플라스미드 pHT01_OleA를 산출하였다.
올레핀 신타아제 오페론을 내포하는 플라스미드:
4개의 유전자: oleA, oleB, oleC와 oleD를 다양한 순서로 내포하는 복수의 플라스미드가 작제되었다. 이들 오페론으로부터 유전자를 발현하는 균주로 시험된 모든 발효물은 올레핀을 생산하였다. 합성 오페론에서 이들 유전자의 순서는 탄화수소를 생산하는 생물체의 능력에 영향을 주지 않는다. 이들 플라스미드 중에서 다수는 하기에 기술된 실시예에서 교체 이용될 수 있다. 각 실시예에서 이용된 실제 플라스미드는 관련 실시예에서 기술된다.
스테노트로포모나스 말토필리아(S. maltophilia)로부터 아미노산 서열에 기초된 ole 유전자를 내포하는 플라스미드에서, 이들 플라스미드는 DNA 서열 내에서 이들 유전자의 순서에 따라서, 예로써 OleA, OleB, OleC, OleD, OleAB, OleBC, OleCD, OleABCD 등으로 명명되었다.
ole 유전자가 다른 생물체의 게놈으로부터 유래되면, 유전자 명칭 뒤에 괄호 안에 상기 유전자가 유래된 생물체의 처음 3개의 문자가 기재된다. 가령, OleA(Xan)는 크산토모나스 악소노포디스(Xanthomonas axonopodis) 게놈 서열에서 발견되는 OleA의 아미노산 서열을 인코딩하는 유전자 서열을 표시한다.
스테노트로포모나스 말토필리아(S. maltophilia) 기초된 단백질 서열을 인코딩하는 oleA, oleB, oleC와 oleD 유전자를 내포하는 합성 오페론이 산출되었다. 이들 ole 유전자는 DNA2.0, Inc.(Menlo Park, CA 94025)에서, 프로그램 변경에 의해 대장균(E. coli) 내에서 발현을 위하여 코돈 최적화되었다.
합성된 유전자 서열(SEQ ID NO: 23)은 플라스미드 pCL1920pTrcOleABpTrcLOleCD를 작제하는데 이용되었다. DNA 2.0에 의해 제공된 합성 올레핀 오페론(SEQ ID NO: 23)은 플라스미드 pCL1920pTrc 내로 서브클로닝하였다. 상기 오페론 단편은 PciI과 HindIII로 절단함으로써 분리하고, NcoI과 HindIII으로 절단된 pCL1920pTrc 플라스미드 내로 결찰시켰다. 생성된 클론은 pCL1920pTrcOleABpTrcLOleCD(SEQ ID NO: 78)로 명명된다.
상이한 순서로 4개의 올레핀 신타아제 유전자(oleA, oleB, oleC와 oleD)를 내포하는 다른 플라스미드, pCL1920pTrcOleCDAB가 작제되고 아래의 실시예 중에서 일부에 이용되었다. 상기 플라스미드는 아래와 같이 작제되었다: 첫째, lacIq 서열을 내포하는 PCR 산물을 pCL1920pTrcOleABpTrcLOleCD의 NheI와 SpeI 절단된 벡터 골격 내로 클로닝함으로써 플라스미드 pCL1920pTrcOleCD를 작제하였다. 생성된 플라스미드는 oleC와 oleD 유전자의 상류에 lacIq 서열을 내포한다. lac 리프레서(repressor) 포함 PCR 산물은 pCL1920pTrc로부터 LB270(SEQ ID NO: 79)과 LB271(SEQ ID NO: 80)을 이용하여 증폭하고, 상기 PCR 산물과 벡터는 NheI과 SpeI 절단으로 클로닝에 대비하였다.
둘째, pCL1920pTrcOleCD 플라스미드 내에서 oleC와 oleD의 하류에 oleA와 oleB를 내포하는 PCR 단편을 클로닝함으로써 오페론 플라스미드, pCL1920pTrcOleCDAB를 작제하였다. 이러한 oleAB PCR 산물은 pCL1920pTrcOleABpTrcLOleCD로부터 LB272(SEQ ID NO: 81)와 LB275(SEQ ID NO: 82)를 이용하여 증폭하였다. 생성된 PCR 산물은 BamHI와 BglII로 절단하고, BamHI와 BglII로 절단된 pCL1920pTrcOleCD 내로 표준 DNA 결찰에 의해 클로닝하고, 남극 포스파타아제(Antarctic Phosphatase)(New England Biolabs, Ipswich, MA 01938)로 처리하였다. 생성된 플라스미드는 pCL1920pTrcOleCDAB로 명명되었다. 유사한 방법을 이용하여 합성 올레핀 오페론을 임의의 관심 벡터 내로 삽입할 수 있다.
바실루스 메가테리움(B. megaterium) 내에서 발현을 위한 플라스미드 pWH1520_OleCDAB를 작제하기 위하여, oleC, oleD, oleA와 oleB는 대장균(E. coli) 내에서 발현을 위하여 코돈 최적화된, 스테노트로포모나스 말토필리아(S. maltophilia)로부터 아미노산 서열에 기초된 뉴클레오티드 서열을 내포하는 DNA 주형 pCL1920pTrcOleCDAB로부터 프라이머 LB402(SEQ ID NO: 488)와 LB387(SEQ ID NO: 489)을 이용하여 PCR 증폭하였다. oleC, oleD, oleA와 oleB를 내포하는 PCR 산물은 SpeI와 BglII로 절단하고, 제한 효소 SpeI와 BamHI를 이용하여 pWH1520 내로 클로닝하여 플라스미드 pWH1520_0leCDAB를 산출하였다.
티오에스테라아제 유전자를 내포하는 플라스미드: Uc FatB1, Cc FatB1, Ch FatB2와 'tesA를 비롯한 상이한 티오에스테라아제에 대한 코딩 영역을 내포하는 복수의 플라스미드가 작제되었다. 대장균(E. coli) 'tesA에 대한 유전자 서열은 대장균(E. coli) MG1655로부터 게놈 DNA로부터 PCR 증폭에 의해 획득되었다. 캘리포니아만월계수(Umbellularia californica) FatB1(Uc FatB1), 장뇌목(Cinnamomum camphora) FatB1(Cc FatB1), 그리고 쿠페아 후케리아나(Cuphea hookeriana) FatB2(Ch FatB2)에 대한 유전자 서열은 계약에 기초된 합성 유전자의 설계와 생산(Codon Devices, Cambridge, MA 02139)에 의해 획득되었다. 간단히 말하면, 'tesA(SEQ ID NO: 25)는 프라이머 TesA_F(SEQ ID NO: 50)와 TesA_R(SEQ ID NO: 51)을 이용하여 증폭하였다. 이들 합성 유전자는 PCR 증폭, 그리고 표준 절단과 결찰 프로토콜로 발현 플라스미드 내로 재클로닝하였다. Cc FatB1(SEQ ID NO: 26)은 프라이머 CcFatB_F(SEQ ID NO: 52)와 CcFatB_R(SEQ ID NO: 53)을 이용하여 증폭하였다. Ch FatB2(SEQ ID NO: 27)는 프라이머 ChFatB2_F(SEQ ID NO: 54)와 ChFatB2_R(SEQ ID NO: 55)을 이용하여 증폭하였다. Uc FatB1(SEQ ID NO: 28)은 프라이머 UcFatB1_F(SEQ ID NO: 56)와 UcFatB1_R(SEQ ID NO: 57)을 이용하여 증폭하였다. 'tesA(SEQ ID NO: 25)와 Cc FatB1(SEQ ID NO: 26) 증폭 산물은 제한 효소 NdeI와 AvrII를 이용하여 pETDuet-1 내로 클로닝하였다. Ch FatB2(SEQ ID NO: 27)와 Uc FatB1(SEQ ID NO: 28) 증폭 산물은 제한 효소 XbaI와 HindIII을 이용하여, malE 유전자와 인 프레임(in frame)으로 pMAL-c2X(NEB, Ipswich, MA) 내로 클로닝하였다.
아실-CoA 신타아제를 내포하는 플라스미드:
fadD 유전자는 2가지 상이한 벡터, pETDuet-1과 pACYCpTrc를 비롯한 다수의 상이한 구조체로부터, 그리고 대장균(E. coli) 숙주 균주 내로 직접적으로 통합된 구조성 프로모터로부터 발현되었다. 이들 구조체는 아래에 기술된다.
pETDuet-1_fadD: 대장균(E. coli)으로부터 아실-CoA 신타아제를 인코딩하는 fadD 유전자는 NcoI/HindIII 절단된 pETDuet-1 벡터 내로 클로닝하였다. fadD 핵산 서열(SEQ ID NO: 492)은 프라이머 fadD_F(SEQ ID NO: 46)와 fadD_R(SEQ ID NO: 47)을 이용하여 대장균(E. coli) C41(DE3)의 게놈 DNA로부터 PCR 증폭하였다. fadD 증폭 산물은 제한 효소 NcoI와 HindIII를 이용하여 pETDuet-1 내로 클로닝하여 pETDuet-1_fadD를 산출하였다.
pACYCpTrcfadD: pACYCpTrcfadD를 작제하기 위하여, 벡터 플라스미드 pACYCpTrc를 먼저 작제하였다. lacIq와 pTrc 프로모터와 종결부위 영역(terminator region)은 pTrcHis2A(Invitrogen, Calrsbad, CA)로부터 프라이머 pTrc_F(SEQ ID NO: 493)와 pTrc_R(SEQ ID NO: 494)을 이용하여 PCR 증폭하였다. PCR 산물은 이후, AatII와 NruI로 절단하였다. PCR 산물은 이후, AatII와 ScaI로 절단된 pACYC177 내로 클로닝하였다. 이러한 fadD 핵산 서열은 대장균(E. coli) C41(DE3)로부터 게놈 DNA로부터 프라이머 fadD_F(SEQ ID NO: 46)와 fadD_R(SEQ ID NO: 47)을 이용하여 PCR 증폭하고 NcoI와 EcoRI 절단으로 pACYCpTrc 내로 클로닝하여 플라스미드 pACYCpTrcFadD를 산출하였다.
아실-CoA 신타아제의 구조성 발현
FadD는 상동성 재조합(allelic exchange)을 이용한, T5 프로모터 서열(SEQ ID NO: 496)을 내포하는 합성 DNA 서열로 fadD 유전자의 상류에서 5' 측면 영역(SEQ ID NO: 495)의 치환과 그 이후에, Cre lox 항균성 내성 마커 제거에 의해 구조성으로 발현되었다(상세한 프로토콜과 관련하여 예로써, Valle, Fernando and Noemi Flores, Ocerexpression of Chromosomal Genes in Escherichia coli. Vol. 267, Recombinant Gene Expression: Reviews and Protocols. Totowa: Humana Press, 2004와 Palmeros et al., Gene, 247: 255-64 (2000)를 참조한다). 간단히 말하면, 프라이머 LB284(SEQ ID NO: 83)와 LB285(SEQ ID NO: 84)를 이용하여 pLoxCat2로부터 loxPcat 카세트(SEQ ID NO: 89; Genebank accession # AJ401047)를 PCR 증폭하였다. 증폭 산물은 MG1655 △fadE 포함 플라스미드 pKD46(Genebank accession # AY048746) 내로 형질전환시켰다. loxPcat 카세트의 통합에 대한 선별후, 상기 균주는 pKD46을 제거하고, 그 이후에 플라스미드 pJW168을 이용하여 클로람페니콜 내성을 제거하였다(Palmeros et al., Gene, 247: 255-64 (2000)). T5 프로모터에 의한 fadD 프로모터의 대체를 확증한 이후, 상기 균주는 pJW168을 제거하였다. 생성된 균주는 대장균(E. coli) MG1655 △,fadE, fadD(+)이었다.
실시예 2
본 실시예에서는 세균 내에서 OleA, OleC와 OleD의 발현이 올레핀의 생산을 결과한다는 것을 설명한다.
oleA, oleC와 oleD 핵산 서열은 PCR을 이용하여 스테노트로포모나스 말토필리아(S. maltophilia)로부터 증폭하였다. 이들 서열은 실시예 1에 기술된 바와 같이, 표준 클로닝 기술을 이용하여 세균 발현 벡터 내로 삽입하였다. oleA, oleC와 oleD를 내포하는 이들 플라스미드를 이용하여 대장균(E. coli) C41(DE3) △fadE를 형질전환시켰다. 유전형(genotype) 대장균(E. coli) C41(DE3) △fadE; pET-21b(+)_OleA, pCOLADuet-1_OleC, pCDFDuet-1 OleD를 갖는 생성된 세균 균주는 5 ㎖ 발효 프로토콜을 이용하여 검사하고 추출 방법 1을 이용하여 추출하였다. 추출물은 탄화수소(가령, 올레핀)와 지방족 케톤의 검출을 위하여, 실시예 1에 기술된 바와 같이 검출 방법 1을 이용한 GC/MS로 분석하였다. GC/MS에 의해 검출된 탄화수소는 C27 내지 C31 범위의 탄소 사슬 길이를 갖는 단일-, 이중-과 삼중-불포화된 올레핀이었다(도 1과 2A-J 참조). 이는 대장균(E. coli) 내에서 oleA, oleC와 oleD의 발현이 올레핀의 생산을 결과한다는 것을 증명하였다. 유사한 방법을 이용하여 임의의 관심 세포에서 oleA, oleC와 oleD를 발현할 수 있다. 이에 더하여, 유사한 방법을 이용하여 지방족 케톤 또는 탄화수소의 생산을 분석할 수 있다.
oleA, oleB, oleC와 oleD의 발현이 광범위한 세균에서 탄화수소의 생산으로 이어진다는 것을 증명하기 위하여, 바실루스 메가테리움(Bacillus megaterium)에서 oleA, oleB, oleC와 oleD의 발현을 위한 플라스미드 pWH1520_0leCDAB를 만들었다(실시예 1 참조). 사전 제조된 바실루스 메가테리움(B. megaterium) WH320 원형질체(Mo Bi Tec, Germany)는 pWH1520_OleCDAB로 형질전환시켜 균주 바실루스 메가테리움(B. megaterium) WH320; pWH1520_OleCDAB를 산출하였다. 사전 제조된 바실루스 메가테리움(B. megaterium) WH320 원형질체(Mo Bi Tec, Germany)는 pWH1520로 형질전환시켜, 빈 벡터 대조로서 이용되는 바실루스 메가테리움(B. megaterium) WH320; pWH1520을 만들었다.
이들 핵산 서열은 oleC, oleD, oleA와 oleB에 대한 스테노트로포모나스 말토필리아(S. maltophilia) 대장균(E. coli)-코돈 최적화된 서열을 내포하는 플라스미드를 이용한 PCR로 증폭하였다. 이들 서열은 대장균(E. coli)에 대한 표준 클로닝 기술을 이용하여 세균 발현 벡터 내로 삽입하였다(실시예 1 참조). 이후, oleA, oleB, oleC와 oleD를 내포하는 플라스미드(pWH1520_OleCDAB)와 빈 벡터 대조 플라스미드(pWH1520)를 이용하여 바실루스 메가테리움(B. megaterium) WH320을 형질전환시켰다.
바실루스 메가테리움(B. megaterium) WH320 원형질체(Mo Bi Tec, Germany)는 이들 원형질체와 함께 제공된 프로토콜(예로써, 바실루스 메가테리움(Bacillus megaterium) protein expression system Handbook 2007 참조)을 이용하여 앞서 언급된 플라스미드로 형질전환시켰는데, 상기 프로토콜은 Puyet et al., FEMS Microbiol. Lett., 40: 1-5. (1987)로부터 방법의 변형이다.
유전형 바실루스 메가테리움(B. megaterium) WH320; pWH1520_OleCDAB와 바실루스 메가테리움(B. megaterium) WH320; pWH1520을 갖는 생성된 세균 균주는 배양액을 유도하기 위하여 IPTG 대신에 0.5% 크실로오스(xylose)를 이용하도록 변형된 5 ㎖ 발효 프로토콜(상기 플라스미드로 형질전환된 세포를 선별하는데 15 ㎎/ℓ 테트라사이클린이 이용되었다)을 이용하여 조사하였다. 이용된 추출 방법은 추출 방법 1이었다.
탄화수소의 존재에 대한 분석은 실시예 1에 기술된 바와 같이 검출 방법 4를 이용한 GC/MS 분석으로 수행하였다. GC/MS 데이터는 각각, 25개, 26개, 27개, 28개, 그리고 29개 탄소를 내포하는 단일-불포화된 올레핀의 생산을 보여주는 별개의 부모 이온 350, 364, 378, 392, 그리고 406에 대하여 이온 추출하였다(도 17A-J 참조).
이들 화합물은 동일한 조건 하에 분석된 동일한 탄소 수를 갖는 직쇄 올레핀보다 조금 일찍 용리한다. 이는 바실루스 메가테리움(B. megaterium)이 분지쇄 올레핀을 생산한다는 것을 암시한다. 바실루스 메가테리움(B. megaterium)이 분지쇄 지방 아실 기질을 자연적으로 생산하기 때문에, 관찰된 올레핀은 분지쇄 올레핀일 가능성이 높다. 탄화수소는 바실루스 메가테리움(B. megaterium) WH320; pWH1520으로부터 대조 추출물에서 검출되지 않았다.
본 실시예에 반영된 이들 실험의 결과는 oleA, oleB, oleC와 oleD를 발현하고 탄화수소를 생산하기 위하여 다양한 세균이 조작될 수 있음을 증명한다. 더 나아가, 본 실시예에서는 oleA, oleB, oleC와 oleD를 발현하고 탄화수소를 생산하기 위하여 그람-양성(Gram-positive) 세균이 조작될 수 있음을 증명한다. 게다가, 본 실시예에서는 oleA, oleB, oleC와 oleD를 발현하고 탄화수소를 생산하기 위하여 바실루스(Bacillus) 속으로부터 세균이 조작될 수 있음을 증명한다. 이에 더하여, 본 실시예에서는 숙주 생물체에 의해 자연적으로 생산되는 지방 아실 사슬(fatty acyl chain)의 유형이 생산되는 탄화수소의 유형에 영향을 준다는 것을 증명한다.
지방족 케톤과 탄화수소(가령, 올레핀)는 또한, 스테노트로포모나스 말토필리아(S. maltophilia)의 세균 세포 펠릿으로부터 추출되고 검출 방법 1을 이용한 GC/MS에 의해 분석되었다. 스테노트로포모나스 말토필리아(S. maltophilia)에 의해 생산된 올레핀(도 3, 4A와 4C 참조)은 대장균(E. coli) oleA, oleC와 oleD에 의해 생산된 올레핀과 상이하다(도 1 참조). 따라서 올레핀 구조(가령, 포화(saturation)의 정도, 사슬 길이, 그리고 가지형 또는 비가지형 사슬의 존재)는 숙주에 좌우된다. 이들 차이는 다양한 유형의 지방 아실 사슬을 생산하는 생물체의 능력의 직접적인 반영이다. 이는 지방산 생합성 경로가 변경되면, 상이한 유형의 올레핀이 생산된다는 것을 증명한다.
oleA가 스테노트로포모나스 말토필리아(S. maltophilia)에서 올레핀의 생산에 필요한 지를 결정하기 위하여, 유전자 결실로 이어지는 상동성 재조합(allelic exchange)의 자살 벡터(suicide vector) 기초된 방법을 이용하여 스테노트로포모나스 말토필리아(S. maltophilia)의 oleA 적중 균주를 산출하였다. 간단히 말하면, oleA 유전자 영역의 결실은 Hoang et al., Gene, 212: 77-86, (1998)에 기술된 유전자 치환(gene replacement) 방법을 이용하여 달성하였다. 더욱 구체적으로, oleA 유전자 영역의 상류와 하류 영역은 SOE PCR 기술(예로써, Horton et al., Gene, 77: 61-8 (1989) 참조)을 이용하여 증폭하고 함께 배치하였다. SOE PCR 산물은 XbaI와 HindIII로 절단하고, XbaI와 HindIII로 절단된 pEX18Tc 자살 벡터 내로 클로닝하였다(Hoang et al.(상기) 참조). 5' 측면 영역은 PCR 프라이머 LB200(SEQ ID NO: 58)과 LB203(SEQ ID NO: 61)을 이용하였다. 3' 측면 영역은 PCR 프라이머 LB201(SEQ ID NO: 59)과 LB205(SEQ ID NO: 63)를 이용하였다. pEX18Tc 내로 클로닝된 병합된 PCR 결실 산물(SEQ ID NO: 75)은 PCR 프라이머 LB202(SEQ ID NO: 60)와 LB204(SEQ ID NO: 62)를 이용한 5'와 3' PCR 산물의 조합으로부터 PCR 증폭에 의해 생산되었다.
야생형 스테노트로포모나스 말토필리아(S. maltophilia)와 돌연변이체 스테노트로포모나스 말토필리아(S. maltophilia) △oleA[oleA가 부재하는 스테노트로포모나스 말토필리아(S. maltophilia)]로부터 추출물은 검출 방법 2를 이용한 GC/MS로 분석하였다. 올레핀은 야생형 스테노트로포모나스 말토필리아(S. maltophilia)에서 관찰되었다(도 4A 참조). 올레핀은 스테노트로포모나스 말토필리아(S. maltophilia) △oleA에서 검출되지 않았다(도 4B 참조). 이들 결과는 oleA 유전자의 결실이 스테노트로포모나스 말토필리아(S. maltophilia)에서 올레핀 생산의 상실을 유발한다는 것을 증명한다.
oleC가 스테노트로포모나스 말토필리아(S. maltophilia)에서 올레핀의 생산에 필요한 지를 결정하기 위하여, 유전자 결실로 이어지는 상동성 재조합(allelic exchange)의 자살 벡터(suicide vector) 기초된 방법을 이용하여 스테노트로포모나스 말토필리아(S. maltophilia)의 oleC 적중 균주를 산출하였다. 간단히 말하면, oleC 유전자 영역의 결실은 Hoang et al., Gene, 212: 77-86, (1998)에 기술된 유전자 치환(gene replacement) 방법을 이용하여 달성하였다. 더욱 구체적으로, oleC 유전자 영역의 상류와 하류 영역은 SOE PCR 기술(예로써, Horton et al., Gene, 77: 61-8 (1989) 참조)을 이용하여 증폭하고 함께 배치하였다. SOE PCR 산물은 XbaI와 HindIII로 절단하고, XbaI와 HindIII로 절단된 pEX18Tc 자살 벡터 내로 클로닝하였다(Hoang et al.(상기) 참조).
5' 측면 영역은 PCR 프라이머 LB110(SEQ ID NO: 465)과 LB112(SEQ ID NO: 467)를 이용하였다. 3' 측면 영역은 PCR 프라이머 LB111(SEQ ID NO: 466)과 LB114(SEQ ID NO: 469)를 이용하였다. pEX18Tc 내로 클로닝된 병합된 PCR 결실 산물(SEQ ID NO: 471)은 PCR 프라이머 LB113(SEQ ID NO: 468)과 LB115(SEQ ID NO: 470)를 이용한 5'와 3' PCR 산물의 조합으로부터 PCR 증폭에 의해 생산되었다.
야생형 스테노트로포모나스 말토필리아(S. maltophilia)와 돌연변이체 스테노트로포모나스 말토필리아(S. maltophilia) △oleC[oleC가 부재하는 스테노트로포모나스 말토필리아(S. maltophilia)]로부터 추출물은 검출 방법 2를 이용한 GC/MS로 분석하였다. 올레핀은 야생형 스테노트로포모나스 말토필리아(S. maltophilia)에서 관찰되었다(도 4A 참조). 올레핀은 스테노트로포모나스 말토필리아(S. maltophilia) △oleC에서 검출되지 않았다(도 4D 참조). 지방족 케톤이 스테노트로포모나스 말토필리아(S. maltophilia) △oleC에서 관찰되었다(도 4D 참조). 이들 결과는 oleC 유전자의 결실이 스테노트로포모나스 말토필리아(S. maltophilia)에서 올레핀 생산의 상실을 유발한다는 것을 증명한다.
oleD가 스테노트로포모나스 말토필리아(S. maltophilia)에서 올레핀의 생산에 필요한 지를 결정하기 위하여, 유전자 결실로 이어지는 상동성 재조합(allelic exchange)의 자살 벡터(suicide vector) 기초된 방법을 이용하여 스테노트로포모나스 말토필리아(S. maltophilia)의 oleD 적중 균주를 산출하였다. 간단히 말하면, oleD 유전자 영역의 결실은 Hoang et al., Gene, 212: 77-86, (1998)에 기술된 유전자 치환(gene replacement) 방법을 이용하여 달성하였다. 더욱 구체적으로, oleD 유전자 영역의 상류와 하류 영역은 SOE PCR 기술(예로써, Horton et al., Gene, 77: 61-8 (1989) 참조)을 이용하여 증폭하고 함께 배치하였다. SOE PCR 산물은 XbaI와 HindIII로 절단하고, XbaI와 HindIII로 절단된 pEX18Tc 자살 벡터 내로 클로닝하였다(Hoang et al.(상기) 참조).
5' 측면 영역은 PCR 프라이머 LB122(SEQ ID NO: 472)와 LB124(SEQ ID NO: 474)를 이용하였다. 3' 측면 영역은 PCR 프라이머 LB123(SEQ ID NO: 473)과 LB127(SEQ ID NO: 476)을 이용하였다. pEX18Tc 내로 클로닝된 병합된 PCR 결실 산물(SEQ ID NO: 477)은 PCR 프라이머 LB125(SEQ ID NO: 475)와 LB127(SEQ ID NO: 476)을 이용한 5'와 3' PCR 산물의 조합으로부터 PCR 증폭에 의해 생산되었다.
야생형 스테노트로포모나스 말토필리아(S. maltophilia)와 돌연변이체 스테노트로포모나스 말토필리아(S. maltophilia) △oleD[oleD가 부재하는 스테노트로포모나스 말토필리아(S. maltophilia)]로부터 추출물은 검출 방법 2를 이용한 GC/MS로 분석하였다. 올레핀은 야생형 스테노트로포모나스 말토필리아(S. maltophilia)에서 관찰되었다(도 4C 참조). 올레핀은 스테노트로포모나스 말토필리아(S. maltophilia) △oleD에서 검출되지 않았다(도 4E 참조). 지방족 케톤이 스테노트로포모나스 말토필리아(S. maltophilia) △oleD에서 관찰되었다(도 4E 참조). 이들 결과는 oleD 유전자의 결실이 스테노트로포모나스 말토필리아(S. maltophilia)에서 올레핀 생산의 상실을 유발한다는 것을 증명한다.
본 실시예에 반영된 이들 실험의 결과는 세균 내에서 oleA, oleC와 oleD의 발현이 올레핀의 생산을 결과한다는 것을 증명한다. 생산된 올레핀은 숙주에 따라서 구조가 달라질 수 있다. 부가적으로, 본 실시예에 반영된 이들 실험의 결과는 OleA, OleC와 OleD가 스테노트로포모나스 말토필리아(S. maltophilia)에서 올레핀의 생산에 필요하다는 것을 증명한다.
실시예 3
본 실시예에서는 세균 내에서 oleA의 발현이 지방족 케톤의 생산을 결과한다는 것을 설명한다.
oleA는 실시예 1과 2에서 기술된 바와 같이 대장균(E. coli)에서 발현시켰다. oleA를 내포하는 플라스미드를 이용하여 대장균(E. coli) C41(DE3)을 형질전환시켰다. 유전형 대장균(E. coli) C41(DE3); pET-21b(+)_OleA을 갖는 생성된 세균 균주는 5 ㎖ 발효 프로토콜을 이용하여 조사하였다. 지방족 케톤과 탄화수소(가령, 올레핀)의 생산에 대한 분석은 추출 방법 1과 그 이후에, 실시예 1에 기술된 바와 같이 검출 방법 1을 이용한 GC/MS 분석으로 수행하였다. GC/MS에 의해 검출된 지방족 케톤은 포화, 단일-불포화, 그리고 이중-불포화 지방족 케톤이었다. 이들 지방족 케톤은 C27 내지 C31 범위의 탄소 사슬 길이를 보였다(도 5A-C와 6A-H 참조).
oleA의 발현이 광범위한 세균에서 지방족 케톤의 생산으로 이어진다는 것을 입증하기 위하여, 바실루스 서브틸리스(Bacillus subtilis)에서 oleA의 발현을 위한 플라스미드 pHT01_OleA를 만들었다(실시예 1 참조). 바실루스 서브틸리스(B. subtilis) IHA01은 pHT01_OleA로 형질전환시켜 균주 바실루스 서브틸리스(B. subtilis) IHA01; pHT01_OleA를 산출하였다. 바실루스 서브틸리스(B. subtilis) IHA01은 pHT01로 형질전환시켜, 대조로서 기능하는 바실루스 서브틸리스(B. subtilis) IHA01; pHT01을 산출하였다.
이들 핵산 서열은 oleA에 대한 스테노트로포모나스 말토필리아(S. maltophilia) 대장균(E. coli)-코돈 최적화된 서열을 내포하는 플라스미드를 이용한 PCR로 증폭하였다. 이들 서열은 대장균(E. coli)에 대한 표준 클로닝 기술을 이용하여 세균 발현 벡터 내로 삽입하였다(예로써, 실시예 1 참조).
이후, oleA를 내포하는 플라스미드(pHT01_OleA)와 빈 벡터 대조 플라스미드(pHT01)를 이용하여 바실루스 서브틸리스(B. subtilis) IHA01을 형질전환시켰다. 바실루스 서브틸리스(B. subtilis)는 Spizizen, Proc . Natl . Acad . Sci . USA, 44: 1072-1078 (1958)의 프로토콜에 따른 자연적인 형질전환(natural transformation)으로 형질전환시켰다.
유전형 바실루스 서브틸리스(B. subtilis) IHA01; pHT01_OleA와 바실루스 서브틸리스(B. subtilis) IHA01; pHT01을 갖는 생성된 세균 균주는 5 ㎖ 발효 프로토콜을 이용하여 조사하였다. 이용된 추출 방법은 추출 방법 1이었다. 지방족 케톤과 탄화수소(가령, 올레핀)의 존재에 대한 분석은 실시예 1에 기술된 바와 같이 검출 방법 4를 이용한 GC/MS로 수행하였다. 25개, 27개와 29개 탄소를 내포하는 포화된 지방족 케톤이 관찰되었다. 개별 C25, C27과 C29 지방족 케톤 각각에 대한 복수 피크는 이들 지방족 케톤의 다수의 상이한 가지형 이성질체가 존재한다는 것을 반영한다(도 18 A-E 참조).
본 실시예에 반영된 이들 실험의 결과는 oleA를 발현하고 지방족 케톤을 생산하기 위하여 다양한 세균이 조작될 수 있음을 증명한다. 더 나아가, 본 실시예에서는 oleA를 발현하고 지방족 케톤을 생산하기 위하여 그람-양성(Gram-positive) 세균이 조작될 수 있음을 증명한다. 게다가, 본 실시예에서는 oleA를 발현하고 지방족 케톤을 생산하기 위하여 바실루스(Bacillus) 속으로부터 세균이 조작될 수 있음을 증명한다. 이에 더하여, 본 실시예에서는 숙주 생물체에 의해 자연적으로 생산되는 지방 아실 사슬(fatty acyl chain)의 유형이 생산되는 탄화수소의 유형에 영향을 준다는 것을 증명한다.
실시예 4
본 실시예에서는 oleA(SEQ ID NO: 2)를 발현하는 대장균(E. coli) 세포로부터 용해질(lysate)을 아실-CoA 기질과 병합하는 시험관내 분석물을 이용하여 지방족 케톤 생산을 유지하는 능력을 설명한다.
oleA는 실시예 1과 3에 기술된 바와 같이 대장균(E. coli)에서 발현시켰다. 생성된 재조합 세균은 배양하고, 유도하고, 작은 덩어리로 뭉치고, 실시예 1에 기술된 바와 같이 OleA를 내포하는 세포 용해질(OleA-세포 용해질)을 만드는데 이용하였다. 시험관내 분석 혼합물은 0.1 M 인산염 완충액 pH 7.0에 현탁된 10 ㎕의 10 mM 미리스토일-CoA 리튬 염(기질) 저장 용액(stock solution)(M4414; Sigma-Aldrich St. Louis, MO), 1 ㎕의 500 mM 트리스(히드록시프로필)포스핀(THP) 환원제(reducing agent), 50 ㎕의 OleA-세포 용해질, 그리고 39 ㎕의 0.1 M 인산염 완충액(phosphate buffer) pH 7.0으로 구성되었다. 기질 또는 OleA-세포 추출물을 내포하거나 내포하지 않는 조합을 포함하는 대조 시료를 또한 준비하였다. 이들 시료는 37℃에서 1시간 동안 배양하였다. 배양 기간후, 추출에 앞서 각 반응물 내로 대조 스파이크(control spike)로서 10 ㎕의 0.1 ㎎/㎖ 헥사코세인(hexacosane) 용액을 첨가하였다. 이들 시료는 1% 아세트산을 내포하는 500 ㎕의 에틸 아세테이트를 이용하여 추출하였다. 혼합물은 와동 혼합기에서 혼합하고, 이후 원심분리하였다. 상층(에틸 아세테이트 층)은 깨끗한 유리 튜브로 이동시키고 진공 하에 원심분리기(Vacufuge 5301, Eppendorf, Westbury, NY)에서 건조시켰다. 이들 시료는 50 ㎕의 에틸 아세테이트에 재현탁시켰다. 실시예 1에 기술된 방법에 따라서, 1 ㎕ 내지 10 ㎕를 GC/MS 또는 GC/FID로 분석하였다. 유사한 방법을 이용하여, 지방족 케톤을 생산하고, 그 이후에 지방족 케톤의 생산을 분석하는데 충분한 조건 하에 임의의 OleA-세포 용해질을 기질과 함께 배양할 수 있다.
GC/MS와 GC/FID에 의해 관찰된 생성된 지방족 케톤은 포화, 단일-불포화, 그리고 이중-불포화되었다. 이들 지방족 케톤은 C27 내지 C31 범위의 탄소 사슬 길이를 보유하였다(도 7A와 7B 참조). 기질과 OleA-추출물을 내포하는 시료는 모든 다른 대조 시료 조합과 비교하였다. 모든 대조 시료와 비교하여 증가된 양으로 C27 지방족 케톤의 생산은 OleA에서 발견된 아실-축합 활성을 암시하였다(도 7C 참조).
본 실시예에 반영된 이들 실험의 결과는 아실 조효소 A가 시험관내 분석물에서 지방족 케톤의 생산을 위한 기질이고, oleA의 발현이 지방족 케톤 생산에 필요하다는 것을 증명한다.
실시예 5
본 실시예에서는 정제된 효소(가령, OleA 단백질)를 0.1 M 인산염 완충액 pH 7.0에서 정제된 기질(가령, 아실-조효소 A, 아실-ACP 등)과 병합하는 시험관내 분석물을 이용하여 지방족 케톤을 유지하는 능력을 설명한다.
oleA는 실시예 1과 3에서 기술된 바와 같이 대장균(E. coli)에서 발현시켰다. 생성된 재조합 세균은 배양하고, 유도하고, 작은 덩어리로 뭉치고, 실시예 1에 기술된 바와 같이 정제된 OleA 단백질을 만드는데 이용하였다. 시험관내 분석 혼합물은 0.1 mM 내지 1 mM의 최종 농도(final concentration)로 희석된 기질(가령, 아실-조효소 A, 아실-ACP, 또는 아실-조효소 A와 아실-ACP의 혼합물), 500 mM 염화마그네슘을 내포하는 0.1 M 인산염 완충액 pH 7.0에서 20 ㎕의 0.6 ㎎/㎖ 정제된 OleA 단백질 용액으로 구성되었다. 각 분석 혼합물은 37℃에서 1시간 동안 배양하였다. 배양 기간후, 250 ㎕의 에틸 아세테이트를 각 분석 혼합물에 첨가하고, 각 분석 혼합물은 와동 혼합기에서 10분 동안 혼합하였다. 이러한 분석 혼합물의 에틸 아세테이트 분취물은 13000 rpm에서 5분 동안 마이크로원심분리기(microcentrifuge)에서 원심분리로 수상(aqueous phase)으로부터 분리하였다. 15 ㎕의 에틸 아세테이트 분취물(상층)은 GC/MS 바이알로 이동시키고, 여기에 각 에틸 아세테이트 분취물 내로 대조 스파이크로서 1.5 ㎕의 0.1 ㎎/㎖ 헥사코세인 용액을 첨가하고, 이후 각 에틸 아세테이트 분취물을 당분야에 널리 공지된 화학적 이온화(chemical ionization) 검출 방법을 이용하여 GC/MS에서 분석하였다(도 8A-B 참조).
C19 내지 C31 범위의 탄소 사슬 길이를 갖는 포화, 단일-불포화, 그리고 이중-불포화 지방족 케톤이 관찰되었다. 대조 분석 혼합물(가령, 기질 없이 정제된 효소를 포함하는 분석 혼합물, 또는 정제된 효소 없이 정제된 기질을 포함하는 분석 혼합물)에서 지방족 케톤은 관찰되지 않았다.
표 16-18에서는 조사된 기질의 조합과 생산된 지방족 케톤의 유형을 예시한다. 지방족 케톤은 아래의 기질 조합으로 형성되었다: 아실-CoA와 아실-CoA, 아실-ACP와 아실-ACP, 그리고 아실-CoA와 아실-ACP(각 조합으로부터 데이터는 각각, 표 16, 17과 18에 열거된다). 기질은 표의 왼쪽 윗부분에 가로로 제시되고, 각 기입사항(entry)은 탄소 사슬의 길이와 그 이후에, 형성된 각 지방족 케톤에 대한 이중 결합의 숫자를 보여준다(가령, C27:1은 27개 탄소와 단일 이중 결합을 보유하는 지방족 케톤을 지칭하고, C23은 23개 탄소를 보유하는 완전 포화된 지방족 케톤을 지칭한다).
본 실시예에 반영된 이들 실험의 결과는 시험관내 분석물이 지방족 케톤의 존재에 의해 OleA 활성을 검출하는데 이용될 수 있음을 증명한다. 이에 더하여, 본 실시예에 반영된 이들 실험의 결과는 아실-조효소 A와 아실-ACP 둘 모두 지방족 케톤을 생산하기 위하여 단독으로 또는 조합으로, OleA에 의한 기질로서 이용될 수 있음을 증명한다. 기질의 사슬 길이와 포화 정도는 넓은 범위의 지방족 케톤 산물을 산출하기 위하여 변할 수 있다.
실시예 6
본 실시예에서는 본 명세서에 기술된 스테노트로포모나스 말토필리아(S. maltophilia) 핵산과 아미노산 서열을 이용한 부가적 oleA, oleC와 oleD 핵산과 아미노산 서열의 확인을 기술한다.
스테노트로포모나스 말토필리아(S. maltophilia) OleA, OleC와 OleD 서열에 관련된 단백질의 아미노산 서열은 nr 데이터베이스를 검색하는 NCBI BLAST 단백질 정렬 프로그램과 다수의 다른 공개 접근가능 데이터베이스를 이용함으로써 결정하였다. oleA, oleC와 oleD 유전자 집단의 부가적 구성원의 활성을 확인하고 조사하는 방법을 설명하기 위하여, 밀접하게 관련된 생물체, 크산토모나스 악소노포디스(Xanthomonas axonopodis)로부터 유전자(oleA, oleC와 oleD), 그리고 간접적으로 관련된 2가지 생물체, 클로로플렉서스 아그레간스(Chloroflexus aggregans)(oleA, oleC와 oleD)와 플레시오시스티스 파시피카(Plesiocystis pacifica)(oleC)로부터 유전자를 클로닝하고 아래와 같이 조사하였다.
본 실시예에 이용된 플라스미드는 실시예 1에 기술된 동일한 세균 균주, 내성 마커, 그리고 PCR 기술을 이용하여 만들었다. 이들 플라스미드의 더욱 상세한 설명을 위하여, 표 15를 참조한다. 유사하게, 탄화수소와 탄화수소 중간물질을 확인하는데 실시예 1에 기술된 5 ㎖ 발효 프로토콜, 탄화수소 추출 방법 1, 그리고 GC/MS 탄화수소 검출 방법 1이 이용되었다.
관심 유전자는 고도로 발현된 자연적인 대장균(E. coli) 단백질을 모방하는 코돈 분포(codon distribution)를 선별하기 위하여 단백질-2-DNA 소프트웨어(예로써, Gustafsson et al., Trends Biotechnol. 22: 346-353 (2004) 참조)를 이용하여 대장균(E. coli) 내에서 발현에 최적화되도록 설계되었다(예로써, Henaut et al., Analysis and predictions from E. coli sequences, In E. coli and Salmonella typhimurium Cellular and Molecular Biology, Volume 2, Edited by: Neidhardt et al., Washington DC, ASM press, pp. 2047-2066 (1996) 참조). 이들 유전자들은 기존 문헌(예로써, Dillon et al., Biotechnique, 9: 298-300 (1990) 참조)에서 기술된 것과 유사한 비-주형(non-template) PCR에 의해 합성되었다. 유전자 합성은 DNA2.0(Menlo Park, CA)에 의해 수행되었다.
이들 합성 개방 해독틀(open reading frame)은 플라스미드 pJ201(DNA 2.0, Menlo Park, CA) 내로 클로닝하였다. 이들 유전자는 NcoI와 HindIII 부위 사이에 복수 클로닝 부위 내에서 T7 프로모터의 상류에 pET21d 내로 서브클로닝하였다. 프라이머는 이들 단백질 서열의 5'와 3' 말단을 보존하도록 설계되었다. 스테노트로포모나스 말토필리아(S. maltophilia)로부터 아미노산 서열(SEQ ID NO:3)에 기초된 코돈 최적화된 이형의 oleA는 LF305(SEQ ID NO: 37)와 LF306(SEQ ID NO: 38) 프라이머(프라이머 서열에 관하여 표 14를 참조한다)를 이용하여 DNA 2.0 플라스미드로부터 PCR 증폭하였다. PCR 산물은 PciI와 HindIII로 절단하고 pET21d 벡터 내로 클로닝하였다. 크산토모나스 악소노포디스(Xanthomonas axonopodis) GenBank 수탁번호 NP_640589.1 GI:21241007(SEQ ID NO: 12)의 아미노산 서열에 기초된 oleA 개방 해독틀(SEQ ID NO:11)은 프라이머 LF307(SEQ ID NO: 39)과 LF308(SEQ ID NO: 40)을 이용하여 DNA 2.0 플라스미드로부터 PCR 증폭하였다. PCR 산물은 PciI와 HindIII로 절단하고 pET21d 벡터 내로 클로닝하였다. 클로로플렉서스 아그레간스(Chloroflexus aggregans) DSM 9485 NCBI GenBank 수탁번호 ZP_01515932.1 GI: 118047293(SEQ ID NO: 18)의 아미노산 서열에 기초된 oleA 개방 해독틀(SEQ ID NO: 17)은 프라이머 LF313(SEQ ID NO: 41)과 LF314(SEQ ID NO: 42)를 이용하여 DNA 2.0 플라스미드로부터 PCR 증폭하였다. PCR 산물은 PciI와 HindIII로 절단하고 pET21d 벡터 내로 클론하였다. 크산토모나스 악소노포디스(Xanthomonas axonopodis)로부터 합성 이형의 oleC(SEQ ID NO: 13)와 oleD(SEQ ID NO: 15) 유전자, 클로로플렉서스 아그레간스(Chloroflexus aggregans)로부터 oleC(SEQ ID NO: 19)와 oleD(SEQ ID NO: 21) 유전자, 그리고 플레시오시스티스 파시피카(Plesiocystis pacifica)로부터 oleC 유전자(SEQ ID NO: 87)는 NcoI와 HindIII를 이용하여 pCOLADuet와 pET21d 벡터 내에서 T7 프로모터 앞에서 DNA 2.0 pJ201 벡터로부터 직접적으로 서브클로닝하였다.
스테노트로포모나스 말토필리아(S. maltophilia), 크산토모나스 악소노포디스(Xanthomonas axonopodis), 그리고 클로로플렉서스 아그레간스(Chloroflexus aggregans)로부터 OleA의 지방족 케톤 생산 활성은 개별 OleA가 대장균(E. coli)에서 발현될 때 지방족 케톤을 검출함으로써 평가하였다. 대장균(E. coli) C41(DE3) 세포는 관심 플라스미드로 형질전환시키고, 앞서 기술된 T7 발현 프로토콜을 이용하여 유도하였다. 그 다음, 추출 방법 1을 이용하여 펠릿을 추출하고 GC/MS 검출 방법 1로 지방족 케톤을 관찰하였다. 유사한 방법을 이용하여 임의의 관심 생물체로부터 OleA를 발현하고, 그 이후에 GC/MS로 지방족 케톤을 검출할 수 있다. GC/MS에 의해 검출된 지방족 케톤은 포화, 단일-불포화, 그리고 이중-불포화되고, C27 내지 C33 범위의 탄소 사슬 길이를 보유하였다(도 9와 표 19 참조).
크산토모나스 악소노포디스(Xanthomonas axonopodis)와 클로로플렉서스 아그레간스(Chloroflexus aggregans)로부터 OleA, OleC와 OleD와 플레시오시스티스 파시피카(Plesiocystis pacifica)로부터 OleC의 탄화수소 신타아제 활성은 올레핀 생산을 조사하는 상보 분석(complementation assay)을 이용하여 평가하였다. 크산토모나스 악소노포디스(X. axonopodis)와 클로로플렉서스 아그레간스(C. aggregans)로부터 OleA의 활성은 스테노트로포모나스 말토필리아(S. maltophilia)로부터 OleC와 OleD를 발현하는 대장균(E. coli) 균주에서 평가하였다. OleC의 활성은 스테노트로포모나스 말토필리아(S. maltophilia)로부터 OleA와 OleD를 발현하는 대장균(E. coli) 균주에서 평가하였다. 더욱 구체적으로, OleA 탄화수소 신타아제 활성을 조사하기 위하여, 세포는 관심 생물체로부터 oleA, oleC(스테노트로포모나스 말토필리아(S. maltophilia))와 oleD(스테노트로포모나스 말토필리아(S. maltophilia))를 보유하는 3개의 플라스미드로 형질전환시켰다. 형질전환된 세포는 이후, 발효, 추출, 그리고 GC/MS 검출 방법을 수행하였다.
OleC 탄화수소 신타아제 활성을 조사하기 위하여, 세포는 oleAB [스테노트로포모나스 말토필리아(S. maltophilia)], 관심 생물체로부터 oleC, 그리고 oleD[스테노트로포모나스 말토필리아(S. maltophilia)]를 보유하는 3개의 플라스미드로 형질전환시켰다. 대장균(E. coli)에 OleB의 부가는 선택적이다. 형질전환된 세포는 이후, 발효, 추출, 그리고 GC/MS 검출 방법을 수행하였다.
OleD 탄화수소 신타아제 활성을 조사하기 위하여, 세포는 oleAB [스테노트로포모나스 말토필리아(S. maltophilia)], oleC[스테노트로포모나스 말토필리아(S. maltophilia)]와 관심 생물체로부터 oleD를 보유하는 3개의 플라스미드로 형질전환시켰다. 대장균(E. coli)에 OleB의 부가는 선택적이다. 형질전환된 세포는 이후, 발효, 추출, 그리고 GC/MS 검출 방법을 수행하였다.
가령, 클로로플렉서스 아그레간스(C. aggregans), 크산토모나스 악소노포디스(X. axonopodis), 그리고 플레시오시스티스 파시피카(P. pacifica)로부터 oleC 활성을 평가하는데 이용되는 균주는 아래의 유전형을 보유하였다: 대장균(E. coli) C41(DE3) ΔfadE; pCOLADuet_OleAB, pCDFDuet_OleD, pET21d_OleC(Chl). 대장균(E. coli) C41(DE3) ΔfadE; pCOLADuet_OleAB, pCDFDuet_OleD, pET21d_OleC(Xan). 대장균(E. coli) C41(DE3) ΔfadE; pCOLADuet_OleAB, pCDFDuet_OleD, pET21d_OleC(Ple). 클로로플렉서스 아그레간스(C. aggregans)와 크산토모나스 악소노포디스(X. axonopodis)로부터 oleD 활성을 평가하는데 이용되는 균주는 아래의 유전형을 보유하였다: 대장균(E. coli) C41(DE3) ΔfadE; pCOLADuet_OleAB, pCDFDuet_OleC, pET21d_OleD(Chl). 대장균(E. coli) C41(DE3) ΔfadE; pCOLADuet_OleAB, pCDFDuet_OleC, pET21d_OleD(Xan). 클로로플렉서스 아그레간스(C. aggregans)와 크산토모나스 악소노포디스(X. axonopodis)로부터 oleA 활성을 평가하는데 이용되는 균주는 아래의 유전형을 보유하였다: 대장균(E. coli) C41(DE3) ΔfadE; pET21d_OleA(Chl); pACYCDuet_OleCD; pCDFDuet_fadD, 그리고 대장균(E. coli) C41(DE3); ΔfadE; pET21d_OleA(Xan); pACYCDuet_OleCD; pCDFDuet_fadD.
스테노트로포모나스 말토필리아(S. maltophilia) 아미노산 서열에만 기초된 ole 유전자가 대장균(E. coli)에서 탄화수소 생산에 필요하지 않다는 것을 입증하기 위하여, 3가지 크산토모나스 악소노포디스(X. axonopodis) 단백질 서열을 인코딩하는 oleA, oleC와 oleD 유전자를 포함하는 균주는 대장균(E. coli)에서 탄화수소 생산을 조사하는데 이용하였다. 대장균(E. coli) C41(DE3) ΔfadE; pET21d_OleA(Xan), pCOLADuet OleD(Xan), pCDF_Duet_OleC(Xan)을 만들고 탄화수소를 생산하는 능력에 대하여 평가하였다. 이후, 펠릿을 추출하고 GC/MS로 탄화수소의 생산에 대하여 분석하였다. GC/MS에 의해 검출된 탄화수소는 C27 내지 C31 범위의 탄소 사슬 길이를 갖는 단일-, 이중-과 삼중-불포화된 올레핀이었다(표 19).
본 실시예에 반영된 이들 실험의 결과는 스테노트로포모나스 말토필리아(S. maltophilia), 크산토모나스 악소노포디스(Xanthomonas axonopodis), 그리고 클로로플렉서스 아그레간스(C. aggregans)로부터 3가지 관련된 OleA 단백질 서열 모두 대장균(E. coli) C41(DE3) △fadE에서 발현될 때 지방족 케톤을 생산하는 기능을 한다는 것을 증명한다. 본 실시예에 반영된 이들 실험의 결과는 또한, 스테노트로포모나스 말토필리아(S. maltophilia), 크산토모나스 악소노포디스(Xanthomonas axonopodis), 그리고 클로로플렉서스 아그레간스(C. aggregans)로부터 OleA 단백질 서열 모두 공지된 기능성 oleC와 oleD 유전자를 발현하는 대장균(E. coli) C41(DE3) △fadE에서 발현될 때 탄화수소를 생산하는 기능을 한다는 것을 증명한다. 부가적으로, 본 실시예에 반영된 이들 실험의 결과는 크산토모나스 악소노포디스(Xanthomonas axonopodis), 클로로플렉서스 아그레간스(C. aggregans), 그리고 플레시오시스티스 파시피카(Plesiocystis pacifca)로부터 3가지 관련된 OleC 단백질 서열 모두 공지된 기능성 oleA와 oleD 유전자를 발현하는 대장균(E. coli) C41(DE3) △fadE에서 발현될 때 올레핀을 생산하는 기능을 한다는 것을 증명한다. 유사하게, 크산토모나스 악소노포디스(Xanthomonas axonopodis)와 클로로플렉서스 아그레간스(Chloroflexus aggregans)로부터 2가지 관련된 OleD 단백질 서열 둘 모두 공지된 기능성 oleA와 oleC 유전자를 발현하는 대장균(E. coli) C41(DE3) △fadE에서 발현될 때 올레핀을 생산하는 기능을 한다. 이에 더하여, 다른 기능성 ole 유전자와 공동으로 활성을 나타내는 ole 유전자는 그들이 동일한 생물체로부터 유래되는 지에 상관없이, 탄화수소를 생산한다. 가령, 크산토모나스 악소노포디스(Xanthomonas axonopodis)로부터 ole 유전자는 스테노트로포모나스 말토필리아(S. maltophilia)로부터 유래된 ole 유전자와 함께, 탄화수소를 생산하는 기능을 한다.
* OleC는 스테노트로포모나스 말토필리아(S. maltophilia) ATCC17679로부터 OleA와 OleD의 존재에서 조사되었다. OleD는 스테노트로포모나스 말토필리아(S. maltophilia) ATCC17679로부터 OleA와 OleC의 존재에서 조사되었다. OleA는 스테노트로포모나스 말토필리아(S. maltophilia) ATCC17679로부터 OleC와 OleD의 존재에서 조사되었다.
본 실시예에서는 지방족 케톤 활성을 갖는 OleA 단백질을 확인하는 생체내 분석 방법을 설명한다. 이에 더하여, 본 실시예에서는 탄화수소 신타아제 활성을 갖는 OleA, OleC와 OleD 단백질을 확인하는 생체내 분석 방법을 설명한다.
실시예 7
본 실시예에서는 공개적으로 가용한 데이터베이스에서 부가적 OleA, OleB, OleC와 OleD 단백질 서열을 확인하는데 아미노산 모티프(amino acid motif)가 이용될 수 있음을 설명한다.
간단히 말하면, 특정 아미노산 패턴(모티프)에 대한 단백질 데이터베이스를 검색하는 프로그램은 인터넷 상에서 가용하다. 이와 같은 한 가지 프로그램은 Kyoto University Bioinformatics Center를 통하여 GenomeNet service에 의해 제공된다. 2007년 8월 1일에 웹사이트 주소는 http://motif.genome.jp/MOTIF2.html이었다. 상기 모티프 검색 프로그램은 사용자에게 아래의 데이터베이스를 검색할 수 있는 능력을 제공한다: Swiss-Prot, PDBSTR, PIR, PRF, GENES와 NR-AA. 사용자는 PROSITE 양식으로 특정 아미노산 패턴을 기입한다(예로써, Hofmann et al., Nucleic Acids Res. 27: 215-219 (1999) 참조). 가령, 각 잔기는 -(minus)에 의해 분리되어야 한다; x는 임의의 아미노산을 나타낸다; [DE]는 D 또는 E를 의미한다; {FWY}는 F, W와 Y를 제외한 임의의 아미노산을 의미한다; A(2,3)은 A가 2회 내지 3회 연속적으로 나타나는 것을 의미한다; 이러한 패턴 문자열(pattern string)은 마침표로 종결되어야 한다. 사용자는 “소정의 패턴에 대한 검색 서열 데이터베이스”를 선택하고, 상기 패턴 상자에서 기술된 바와 같이 특정 아미노 패턴(amino pattern)을 기입하고, 검색되는 데이터베이스를 선택한다.
표 3, 7과 10에 열거된 모티프가 부가적 OleA 단백질을 확인하는데 이용될 수 있다. 가령, OleA 단백질 클러스터(cluster)를 정의하는 모티프인 [LF]-X-X-[IVLM]-[ATSV]-G-[IV]-X-[EAHS]-R-R-X-W(SEQ ID NO: 64)가 앞서 기술된 바와 같이 모티프 검색 프로그램에 기입되었다. 이러한 질문에 대한 전형적인 검색 결과는 하기 표 20에 열거된다.
유사하게, 표 4, 9와 12에 열거된 모티프가 탄화수소 신타아제 활성을 갖는 부가적 OleD 효소를 확인하는데 이용될 수 있다. 이들 모티프는 또한, 데히드로게나아제 활성을 갖는 OleD 효소를 확인하는데 이용될 수 있다. 표 5, 8과 11에 열거된 모티프는 탄화수소 신타아제 활성을 갖는 부가적 OleC 효소를 확인하는데 이용될 수 있다. 표 6에 열거된 모티프는 탄화수소 신타아제 활성을 갖는 부가적 OleB 효소를 확인하는데 이용될 수 있다.
본 실시예의 결과는 OleA, OleB, OleC와 OleD에 대한 아미노산 모티프가 부가적 OleA, OleB, OleC와 OleD 아미노산 서열을 확인하는데 이용될 수 있음을 증명한다. 당업자는 또한, OleA, OleB, OleC와 OleD 아미노산 서열을 이용하여, 상응하는 아미노산 서열을 인코딩하는 상응하는 oleA, oleB, oleC와 oleD 유전자를 확인할 수 있을 것이다. 더욱 구체적으로, 이들 결과는 부가적 OleA, OleB, OleC와 OleD 효소를 확인하기 위하여 데이터베이스를 검색하는데 SEQ ID NO: 64-74와 91-133이 이용될 수 있음을 증명한다.
실시예 8
본 실시예에서는 지방산 생합성 경로가 변경된 세포에서 OleA의 발현이 지방족 케톤의 강화된 생산을 결과한다는 것을 설명한다.
OleA는 실시예 1과 3에 기술된 바와 같이 다양한 대장균(E. coli) 세포에서 발현시켰다. 생성된 재조합 세균은 배양하고, 유도하고, 작은 덩어리로 만들고, 발효 방법 2, 추출 방법 1과 검출 방법 1을 이용하여 추출하였다. GC/MS에 의해 검출된 지방족 케톤은 포화, 단일-불포화, 그리고 이중-불포화되고, C27 내지 C31 범위의 탄소 사슬 길이를 보유하였다.
8가지 상이한 대장균(E. coli) 숙주가 조사되었다:
(1) 야생형 대장균(E. coli) C41(DE3);
(2) 아실-CoA 데히드로게나아제 fadE의 완전한 결실을 보유하는 대장균(E. coli) C41(DE3) △fadE;
(3) IPTG로 유도 이후에 fadD를 발현하는 플라스미드를 포함하는 대장균(E. coli) C41(DE3);
(4) IPTG로 유도 이후에 fadD를 발현하는 플라스미드를 포함하는 대장균(E. coli) C41(DE3) △fadE;
(5) IPTG로 유도 이후에 tesA 티오에스테라아제 A 유전자의 절두된 이형, 'tesA를 발현하는 플라스미드를 포함하는 대장균(E. coli) C41(DE3);
(6) IPTG로 유도 이후에 tesA 티오에스테라아제 A 유전자의 절두된 이형, 'tesA를 발현하는 플라스미드를 포함하는 대장균(E. coli) C41(DE3) △fadE;
(7) IPTG로 유도 이후에 발현되는 개별 플라스미드 상에 'tesA와 fadD 둘 모두 내포되는 대장균(E. coli) C41(DE3); 그리고
(8) IPTG로 유도 이후에 발현되는 개별 플라스미드 상에 'tesA와 fadD 둘 모두 내포되는 대장균(E. coli) C41(DE3) △fadE.
지방산 경로 중간물질의 생산을 변경하는 플라스미드(가령, fadD와 'tesA)는 표준 분자생물학 방법을 이용하여 만들었다. 모든 클로닝된 유전자는 IPTG-유도성 프로모터(가령, T7, tac 또는 lac 프로모터)의 제어 하에 놓였다. 대장균(E. coli)의 'tesA 유전자[SEQ ID NO: 25; 리더 서열이 없는 티오에스테라아제 A 유전자 수탁 NP 415027(Cho et al., J. Biol . Chem ., 270: 4216-9 (1995), EC: 3,1,1,5,3.1.2,-]은 NdeI/AvrII 절단된 pETDuet-1(본 명세서에 기술된 pETDuet-1은 EMD Chemicals, Inc.(San Diego, CA)로부터 구입가능하다) 내로 클로닝하였다.
대장균(E. coli)으로부터 아실-CoA 신타아제를 인코딩하는 fadD 유전자(SEQ ID NO: 492)는 NcoI/HindIII 절단된 pCDFDuet-1 내로 클로닝하였다. 표 15에서는 여러 전형적인 생산 균주를 만들기 위하여 산출된 플라스미드의 요약을 열거한다. 당업자는 상이한 플라스미드와 게놈 변형이 유사한 균주를 획득하는데 이용될 수 있음을 인식할 것이다.
지방족 케톤 생산은 앞서 기술된 fadE, fadD 및/또는 tesA에서 상이한 변형을 보유하는 각 대장균(E. coli) 균주에서 oleA가 발현될 때 증가하였다(도 10 참조). 가령, 한 시스템에서 대장균(E. coli) 'tesA(pETDuet-1-'tesA)의 과다발현은 OleA 단백질을 발현하는 대장균(E. coli) C41(DE3)과 비교하여 지방족 케톤 생산에서 2.6 배 증가를 결과하였다. 다른 실례에서, 'tesA와 fadD의 과다발현을 fadE의 결실과 병합하는 대장균(E. coli) 균주에서 oleA의 발현은 OleA 단백질을 발현하는 대장균(E. coli) C41(DE3)과 비교하여 지방족 케톤 생산에서 5배 증가를 결과하였다.
본 실시예의 결과는 세포의 지방산 생합성 경로에 관여하는 유전자에서 변경과 공동으로, oleA를 발현하는 세균 세포에 의해 생산된 지방족 케톤에서 증가를 유지하는 능력을 증명한다.
실시예 9
본 실시예에서는 지방산 생합성 경로가 변경된 세포에서 oleA, oleC와 oleD의 발현이 강화된 올레핀의 생산을 결과한다는 것을 설명한다.
oleA, oleC와 oleD는 실시예 8에 기술된 대장균(E. coli) 균주에서 발현시켰다. 생성된 재조합 세균은 배양하고, 유도하고, 작은 덩어리로 만들고, 그리고 발효 방법 2, 추출 방법 1과 검출 방법 1을 이용하여 추출하였다. GC/MS에 의해 검출된 생성된 올레핀은 단일-불포화, 이중-불포화, 그리고 삼중-불포화되고, C27 내지 C31 범위의 탄소 사슬 길이를 보유하였다.
'tesA와 fadD의 과다발현을 fadE의 결실과 병합하는 대장균(E. coli) 균주에서 oleA, oleC와 oleD의 발현은 야생형 대장균(E. coli) 배경에서 oleA, oleC와 oleD를 발현하는 대장균(E. coli) 균주와 비교하여 관찰된 올레핀의 양에서 4배 증가를 결과하였다(도 11 참조).
본 실시예에 반영된 이들 실험의 결과는 지방산 생합성 경로에서 변경과 공동으로, oleA, oleC와 oleD가 발현되는 세포에서 현저하게 증가된 양의 올레핀이 유지된다는 것을 증명한다.
실시예 10
본 실시예에서는 OleA와 OleD를 포함하는 시험관내 분석물에서 알데히드, 지방족 케톤과 올레핀이 관찰된다는 것을 설명한다.
His-표식된 OleA와 OleD 단백질은 제조업체의 프로토콜(Novagen, CA)에 따라 Overnight Express Instant TB 배지를 이용하여 대장균(E. coli) C41(DE3) ΔfadE에서 발현시켰다. 이들 단백질은 500 mM NaCl, 20 mM Tris-HCl, 5 mM 이미다졸 pH 7.9와 1 mM 트리스(히드록시프로필)포스핀(THP)[1X 결합 완충액(binding buffer)]을 이용한 His Bind 칼럼 크로마토그래피로 정제하였다. 그 이후에, 사용자 프로토콜 TB054 Rev. F0106(Novagen; EMD Chemicals, Inc., San Diego, CA)에 기재된 사용설명서에 따라 500 mM NaCl, 60 mM 이미다졸, 20 mM Tris-HCl pH 7.9와 1 mM THP[1X 세척 완충액(wash buffer)]으로 처리되었다. OleA 단백질은 1 M 이미다졸, 0.5 M NaCl과 20 mM Tris-HCl pH 7.9를 이용한 His-bind 칼럼으로부터 용리하였다. OleD 단백질은 0.5 M NaCl, 100 mM EDTA와 20 mM Tris-HCl pH 7.9를 이용한 His-bind 칼럼으로부터 용리하였다. 모든 단백질은 제조업체의 프로토콜(GE Healthcare, NJ)에 따라 PD-10 칼럼을 이용하여 50 mM Tris pH 7.5, 100 mM NaCl, 1 mM THP와 10% 글리세롤로 완충액 교환하였다.
정제되고 His-표식된 OleA와 OleD 단백질은 시험관내 분석에 이용하였다. 시험관내 분석 반응물은 100 ㎕의 총 부피에서, 1 mM 미리스토일 조효소 A, 10 mM MgCl2, 2.3 μM OleA, 2.4 μM OleD, 10 mM NADPH와 100 mM 인산염 완충액(pH 7.0)을 내포하였다. 상기 분석에 이용된 NADPH는 Sigma(N7505, St Louis MO)로부터 구입하고, 50 mM Tris pH 7.5에서 100 mM 저장 용액(stock solution)으로서 제조하였다. 시료는 37℃에서 1시간 동안 배양하였다. 반응은 1% 아세트산을 내포하는 500 ㎕의 에틸 아세테이트로 진정(quenched)시켰다. 혼합물은 와동(vortexing)과 그 이후에, 원심분리로 혼합하였다. 상층(에틸 아세테이트 층)은 깨끗한 유리 튜브로 이동시키고 진공 하에 원심분리기(Vacufuge 5301, Eppendorf, Westbury, NY)에서 건조시켰다. 상기 시료는 40 ㎕의 에틸 아세테이트와 대조 스파이크로서 작용하는 10 ㎕의 0.1 ㎎/㎖ 헥사코세인 용액(에틸 아세테이트에서 제조됨)에 재현탁시키고, GC/MS(작업 시간: 37.33분; 칼럼: HP-5-MS(5% 디페닐 실록산, 95% 디메틸 실록산) Part No. 19091S-433E, 길이: 30(meter), 내부 직경: 0.25(㎜) narrowbore, 필름: 0.25(μM); MSD 스캔 범위: 50 - 550 m/z; 주입: 1 ㎕ Agilent 6890 N 주입기; 주입기: 300℃ 비분할; 담체 가스: 헬륨(유속: 1.3 ㎖/min); 오븐 온도: 60℃에서 3분간 유지, 32O℃까지 15℃/min, 320℃에서 17분간 유지; 검출기: Agilent 5975B XL EI/CI MSD; 검출기 온도: 300℃)로 분석하였다. 탄화수소 함량에 대하여 1 내지 10 ㎕를 분석하였다.
GC/MS에 의해 검출된 생성된 알데히드, 케톤과 올레핀은 테트라데카날, 14-헵타코사논, 그리고 헵타코센의 이성질체이었다(도 12A-E 참조). 이들 화합물은 체류 시간과 MS 스펙트럼 프로필에 기초하여 확인하였다.
본 실시예에 반영된 실험의 결과는 시험관내 분석물에서 OleA와 OleD를 이용하여 알데히드, 지방족 케톤과 올레핀을 유지하는 능력을 증명한다. 구체적으로, 이들 결과는 시험관내 분석물에서 미리스토일 조효소 A, MgCl2와 NADPH의 존재에서 OleA와 OleD의 배양 이후에, 알데히드, 지방족 케톤과 올레핀이 유지된다는 것을 증명한다.
실시예 11
본 실시예에서는 아실 조효소 A 기질, OleA와 OleD를 포함하는 시험관내 분석물에서 관찰되는 알데히드와 올레핀의 양이 상기 시험관내 분석물에 정제된 OleB 단백질이 첨가될 때 현저하게 강화된다는 것을 설명한다.
His-표식된 OleA와 OleD 단백질은 실시예 10에 기술된 바와 같이 His Bind 칼럼 크로마토그래피를 이용하여 발현시키고 정제하였다. His-표식된 OleB 단백질은 실시예 10에 기술된 방법을 이용하여 발현시키고 정제하였다. OleA와 OleB 단백질은 1 M 이미다졸, 0.5 M NaCl과 20 mM Tris-HCl pH 7.9를 이용한 His-bind 칼럼으로부터 용리하였다. OleD 단백질은 0.5 M NaCl, 100 mM EDTA와 20 mM Tris-HCl pH 7.9를 이용한 His-bind 칼럼으로부터 용리하였다. 모든 단백질은 제조업체의 프로토콜(GE Healthcare, NJ)에 따라 PD-10 칼럼을 이용하여 50 mM Tris pH 7.5, 100 mM NaCl, 1 mM THP와 10% 글리세롤로 완충액 교환하였다.
정제되고 His-표식된 OleA, OleD와 OleB 단백질은 시험관내 분석에 이용하였다. 시험관내 분석 반응물은 100 ㎕의 총 부피에서, 1 mM 미리스토일 조효소 A, 10 mM MgCl2, 2.3 μM OleA, 2.4 μM OleD, 2.3 μM OleB, 10 mM NADPH와 100 mM 인산염 완충액(pH 7.0)을 내포하였다. 시료는 37℃에서 1시간 동안 배양하였다. 반응은 1% 아세트산을 내포하는 500 ㎕의 에틸 아세테이트로 진정시켰다. 혼합물은 와동과 그 이후에, 원심분리로 혼합하였다. 상층(에틸 아세테이트 층)은 깨끗한 유리 튜브로 이동시키고 진공 하에 원심분리기(Vacufuge 5301, Eppendorf, Westbury, NY)에서 건조시켰다. 상기 시료는 40 ㎕의 에틸 아세테이트와 대조 스파이크로서 작용하는 10 ㎕의 0.1 ㎎/㎖ 헥사코세인 용액(에틸 아세테이트에서 제조됨)에 재현탁시키고 GC/MS로 분석하였다. 존재하는 알데히드, 지방족 케톤과 올레핀의 양에 대하여 1 내지 10 ㎕를 분석하였다.
GC/MS에 의해 검출된 생성된 알데히드, 지방족 케톤과 올레핀은 테트라데카날, 14-헵타코사논, 그리고 헵타코센의 이성질체이었다(도 13A-C 참조). 이들 화합물은 체류 시간과 MS 스펙트럼 프로필에 기초하여 확인하였다. 각 화합물에 대한 피크 아래 영역(AP)은 MSD ChemStation 소프트웨어(Agilent technologies)를 이용하여 평가하였다. 이들 상대적 수치는 OleA/OleD에 의해 생산된 각 반응 산물을 1.0으로 표준화시킴으로써 계산하였다[가령, OleA + OleD + OleB에 의해 생산된 알데히드 = AP(OleA + OleD + OleB 반응)/AP(OleA + OleD 반응)]. OleA+OleD와 OleA+OleD+OleB에 의해 생산된 알데히드, 올레핀과 지방족 케톤의 상대적 수치는 표 21에 열거된다.
본 실시예에 반영된 실험의 결과는 OleA, OleD와 OleB를 포함하는 시험관내 분석물에서 관찰되는 알데히드 또는 올레핀의 양이 OleA와 OleD를 포함하는 시험관내 분석물에서 관찰되는 알데히드 또는 올레핀의 양보다 많다는 것을 증명한다.
실시예 12
본 실시예에서는 올레핀 신타아제 유전자(oleA, oleB, oleC와 oleD)와 공동으로, 아실-CoA 신타아제 유전자를 발현하는 세균에 의해 지방산이 올레핀으로 전환될 수 있음을 설명한다.
아실-CoA 신타아제 유전자는 유리 지방산을 활성화된 지방 아실-CoA로 변환시키는데, 이는 올레핀 신타아제 유전자에 대한 기질 중의 하나이다. 다수의 상이한 숙주 균주가 아실-CoA 신타아제 유전자로 형질전환되었다. 이들 올레핀 신타아제 유전자는 일련의 생물변환(bioconversion) 실험에 이용되었다. 모든 숙주 균주는 유사한 결과를 산출하고, 실시예 1에 기술된 플라스미드로 표준 분자생물학 기술을 이용하여 생산되었다. 본 실시예에 제시된 데이터를 산출하기 위하여 아래의 숙주 균주가 이용되었다:
숙주 1: 올레핀 신타아제 오페론 pCL192OpTrcOleABpTrcOleCD(SEQ ID NO: 78)와 아실-CoA 신타아제 FadD 과다발현 플라스미드 pACYCpTrcFadD로 형질전환된 대장균(E. coli) MG1655 △fadE.
숙주 2: 올레핀 신타아제 오페론 pCL1920pTrcOleABpTrcOleCD(SEQ ID NO: 78)와 아실-CoA 신타아제 FadD 과다발현 플라스미드 pETDuetFadD로 형질전환된 대장균(E. coli) C41 (DE3) △fadE.
생물변환 실험은 실시예 1에 기술된 25 ㎖ 발효 절차를 이용하여 수행하였다. 유도 시점에서, 0.01% 내지 0.05%(w/v, weight by volume) 지방산의 최종 농도로 유리 지방산을 배양 배지에 첨가하였다. 1 ㎖ 전체 세포 배양 방법을 이용하여 탄화수소를 추출하였다. 산물은 실시예 1에 기술된 바와 같이 GC/MS를 이용하여 분석하였다.
GC/MS에 의해 검출된 탄화수소는 C19 내지 C33 범위의 단일-, 이중-과 삼중-불포화된 사슬이었다. 발효물과 검출된 올레핀 산물에 첨가된 지방산 기질의 유형은 표 22에 열거된다. 검출되는 올레핀의 양과 유형은 배양 배지에 첨가되는 지방산 기질의 유형에 따라서 변하였다. 이는 첨가가 없었던 대조 균주에서 검출되지 않는 올레핀을 상기 균주가 생산할 때 가장 현저하다. 가령, 표 22에서는 C10 지방산이 C19:1 올레핀으로 변환된다는 것을 보여주는데, 이는 2개의 C10 지방 아실-CoA 분자의 축합을 반영한다. C23:1과 C23:2 올레핀 역시 형성된다. 이는 상기 대장균(E. coli) 숙주 균주에 의해 자연적으로 생산되는 C14:0 또는 C14:1 지방 아실-활성화된 에스테르와 C10 지방 아실-CoA의 축합을 반영한다. 더욱 긴 사슬 올레핀, 이를테면, C31:3은 세포가 C16:1 지방산을 올레핀으로 변환시킬 때 형성된다. 비-고유 지방산 기질, 이를테면, 홀수 사슬 지방산 C13, C15와 C17이 공급될 때, C26, C28과 C30의 독특한 짝수 사슬 올레핀이 검출되었다. 이는 이들 외인성 지방산이 올레핀으로 변환된다는 것을 암시한다.
지방산의 생물변환은 대부분의 실험에서 올레핀의 전체 생산을 강화시켰다. 가령, C13, C14, C14:1과 C16:1 지방산을 공급한 이후에 생산된 올레핀의 전체량은 이러한 공급이 없는 대조 균주에서 생산된 올레핀의 양과 비교하여 2배 이상 증가하였다(표 23 참조).
본 실시예에 반영된 이들 실험의 결과는 대장균(E. coli)에서 OleA, OleB, OleC, OleD와 FadD의 발현이 외인성과 내인성 지방산으로부터 유래된 올레핀의 생산을 결과한다는 것을 증명한다. 이에 더하여, 본 실시예에 반영된 이들 실험의 결과는 지방산 공급된 세균에서 OleA, OleB, OleC, OleD와 FadD의 발현이 지방산의 올레핀으로의 생물변환과 전체 올레핀 생산에서 현저한 증가를 결과한다는 것을 증명한다. 게다가, 본 실시예에서는 생물변환이 숙주에 의해 생산된 올레핀의 유형을 제어하는데 이용될 수 있음을 증명한다.
실시예 13
본 실시예에서는 아실-축합 효소 OleA와 공동으로, 아실-CoA 신타아제 유전자를 발현하는 세균에 의해 지방산이 지방족 케톤으로 변환될 수 있음을 설명한다.
아실-CoA 신타아제 유전자는 유리 지방산을 활성화된 지방 아실-CoA로 변환시키는데, 이는 OleA 아실-CoA 축합 반응을 위한 기질 중의 하나이다.
본 실시예에 제시된 데이터를 산출하기 위하여 아래의 숙주 균주가 이용되었다: 고유 프로모터를 T5 구조성 프로모터로 대체함으로써 산출된 구조성으로 발현된 fadD 유전자(실시예 1 참조)를 포함하고, OleA의 발현을 위하여 pCL1920pTrcOleA 플라스미드(본 플라스미드에 관한 설명은 실시예 1을 참조한다)로 형질전환된 대장균(E. coli) MG1655 △fadE. 상기 숙주 균주는 배양하고, IPTG로 유도하고, 그리고 실시예 12에 기술된 절차에 따라서 상이한 사슬 길이의 지방산을 공급하였다. 1 ㎖ 전체 세포 배양 방법을 이용하여 탄화수소를 추출하였다. 산물은 실시예 1에 기술된 바와 같이 GC/MS를 이용하여 분석하였다.
GC/MS에 의해 검출된 탄화수소는 C19 내지 C31 범위의 포화된 지방족 케톤, 그리고 단일-과 이중-불포화된 지방족 케톤이었다. 발효물과 검출된 지방족 케톤에 첨가된 지방산의 유형은 표 18에 열거된다. 비-고유 지방산, 이를테면, C13, C15와 C17이 공급된 후, 짝수 탄소-사슬 지방족 케톤이 생산되었다.
지방산의 생물변환은 검사된 모든 시료에서 지방족 케톤의 생산을 강화시켰는데, 선호되는 기질, 이를테면, C14:1을 공급할 때 50배 이상 강화되었다(표 25 참조).
본 실시예에 반영된 이들 실험의 결과는 대장균(E. coli)에서 OleA와 FadD의 발현이 외인성과 내인성 지방산으로부터 유래된 지방족 케톤의 생산을 결과한다는 것을 증명한다. 이에 더하여, 본 실시예에 반영된 이들 실험의 결과는 지방산 공급된 세균에서 OleA와 FadD의 발현이 지방산의 지방족 케톤으로의 생물변환과 전체 지방족 케톤 생산에서 현저한 증가를 결과한다는 것을 증명한다. 본 실시예에서는 생물변환이 숙주 균주에 의해 생산된 지방족 케톤의 유형을 제어하고 생산되는 지방족 케톤의 양을 강화시키는데 이용될 수 있음을 증명한다.
실시예 14
본 실시예서는 세균에서 생산될 수 있는 올레핀의 유형을 제어하는 방법을 설명한다.
세균에서 상이한 사슬 길이의 아실-CoA(지방족 케톤과 올레핀 합성을 위한 기질)를 생산하기 위하여, Uc FatB1(Voelker et al., Science, 257: 72-74 (1992)), Ch FatB2(Dehesh et al, Plant J., 9: 167-72 (1996)), 'TesA(Cho et al., 상기), 또는 Cc FatB1(Yuan et al., Proc . Natl . Acad . Sci. USA, 92: 10639-43 (1995))을 비롯한 상이한 티오에스테라아제가 아실-CoA 신타아제(FadD; EC 6.2.1.3)와 공동으로 생산되었다. 상이한 사슬 길이를 갖는 올레핀을 생산하기 위하여, 생산된 아실-CoA 기질의 유형에서 변이(즉, 상이한 티오에스테라아제를 발현하는 세균)는 올레핀 신타아제 유전자 oleA, oleB, oleC와 oleD와 병합되었다.
변하는 사슬 길이를 갖는 올레핀을 생산하는 능력을 나타내는 다수의 균주가 산출되었다(표 26 참조). 모든 균주는 표준 형질전환 방법, 이를테면, 전기천공(electroporation) 또는 화학적 형질전환(chemical transformation)을 이용하여 대장균(E. coli) C41(DE3) △fadE 숙주에서 만들었다. 상기 균주 내에 각 플라스미드를 유지하기 위하여, 실험 과정 동안 적절한 항생제 선별(antibiotic selection)을 적용하였다. 티오에스테라아제 플라스미드를 내포하지 않는 대조 균주(OS333)를 산출하였다. 이에 더하여, 티오에스테라아제, 지방 아실-CoA 신타아제, 그리고 올레핀 신타아제 유전자의 조합을 발현하는 균주를 산출하였다. 각 플라스미드의 작제에 관한 상세한 설명은 실시예 1에서 확인할 수 있다. 본 실시예에 이용되는 균주의 목록은 표 26에 열거된다.
표준 25 ㎖ 발효와 표준 1 ㎖ 전체 세포 배양 추출은 실시예 1에 기술된 바와 같이 수행하였다. 시료는 실시예 1에 기술된 GC/MS 방법으로 분석하였다. 헥사코세인을 내부 표준(internal standard)으로 이용하여, 생산된 각 올레핀의 양을 측정하였다(표 27 참조).
1962년에, Marr와 Ingraham은 온도가 대장균(E. coli)에 의해 생산된 지질에서 포화도(degree of saturation)에 영향을 준다는 것을 증명하는 논문을 발표하였다(Marr et al., J Bacteriol ., 84: 1260-7 (1962)). 낮은 온도는 더욱 높은 불포화도를 갖는 지질의 생산을 결과하는 반면, 더욱 높은 온도는 더욱 많은 양의 포화된 지질을 결과한다. 온도가 포화도에 영향을 주는 지를 결정하기 위하여, 2가지 상이한 온도, 37℃와 25℃에서 발효를 수행하였다. 표 27의 위쪽에서는 37℃에서 수행된 발효에 대한 결과를 열거하고, 표 27의 아래쪽에서는 25℃에서 수행된 발효에 대한 결과를 열거한다.
올레핀의 길이와 불포화도는 CX:Y로서 표시되는데, 여기서 X는 올레핀 내에서 탄소의 숫자를 지시하고 Y는 이중 결합의 숫자를 지시한다.
표 27에 반영된 결과는 지방 아실-CoA 신타아제와 올레핀 신타아제 유전자와 공동으로 티오에스테라아제의 발현이 이용된 티오에스테라아제에 따라서, 상이한 사슬 길이를 갖는 올레핀을 생산한다는 것을 증명한다. 티오에스테라아제, 이를테면, C12:0 지방 아실-ACP에 대한 특이성(specificity)을 갖는 라우로일-아실 담체 단백질 티오에스테라아제로 알려져 있는 Uc FatB1, 그리고 Ch FatB2가 대조 균주에서 관찰되지 않는 C23과 C25 길이 올레핀을 생산하는데 이용될 수 있다. 이들 결과는 또한, 특정 올레핀, 이를테면, C27 올레핀의 양이 C14 지방 아실-ACP에 대한 특이성을 갖는 티오에스테라아제, 이를테면, Cc FatB1의 부가에 의해 강화될 수 있음을 증명한다. 대안으로, C27과 C29의 양이 C14와 C16 사슬 길이 지방 아실-ACP에 대한 특이성을 갖는 'TesA의 부가에 의해 강화될 수 있다.
표 27에 열거된 결과는 또한, 발효가 진행되는 온도가 세균에 의해 생산된 올레핀의 유형에 영향을 준다는 것을 증명한다. 특히, 온도는 생산되는 올레핀의 포화 수준에 영향을 준다. 단일 이중 결합을 보유하는 올레핀은 2개의 포화된 지방산의 축합으로부터 형성된다. 37℃에서 진행된 발효는 25℃에서 진행된 발효와 비교하여 더욱 높은 포화도를 갖는 올레핀의 생산을 결과한다.
본 실시예에 반영된 이들 실험의 결과는 상이한 사슬 길이 지방 아실-CoA를 생산하는 유전자와 올레핀 신타아제 유전자를 병합함으로써, 생산되는 올레핀의 길이가 제어될 수 있다는 것을 증명한다. 이에 더하여, 본 실시예에 반영된 이들 실험의 결과는 세균에 의해 생산된 올레핀에서 포화도가 환경 조건(environmental condition), 이를테면, 발효 온도를 변경함으로써 제어될 수 있다는 것을 증명한다.
실시예 15
본 실시예에서는 사카로미세스 세레비시아(Saccharomyces cerevisiae)에서 oleA의 기능성 발현이 지방족 케톤의 시험관내 생산을 결과한다는 것을 설명한다.
oleA 핵산 서열은 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia) ATCC 17679 oleA 유전자 서열(SEQ ID NO: 1)을 내포하는 플라스미드로부터 표준 방법으로 PCR 증폭되고, 본 명세서에 기술된 바와 같이 표준 기술을 이용하여 효모 발현 벡터 내로 클로닝되었다. 간단히 말하면, oleA(SEQ ID NO: 1)는 프라이머 LB217(SEQ ID NO: 43)과 LF304(SEQ ID NO: 44)를 이용하여 증폭하였다. oleA 증폭 산물은 제한 효소 ApaI와 XhoI를 이용하여 pESC-HIS 내로 클로닝하여 플라스미드 pESC-His-oleA(SEQ ID NO: 134)를 산출하였다.
이후, 사카로미세스 세레비시아(S. cerevisiae)(BY4741) 효모 세포는 oleA를 내포하는 플라스미드(SEQ ID NO: 134) 또는 oleA를 내포하지 않는 플라스미드로 형질전환시켰다. 형질전환된 효모 세포는 oleA가 발현되도록 배양하였다. 이들 세포는 작은 덩어리로 만들고 YeastBuster™(Novagen, Madison, WI)을 이용하여 용해시켰다. 미리스토일-CoA를 세포 용해질에 첨가하였다. 지방족 케톤은 에틸 아세테이트에서 1% 아세트산을 이용하여 반응물로부터 추출하고 실시예 1에 기술된 바와 같이 GC/MS로 분석하였다.
oleA 플라스미드 pESC-His-oleA로 형질전환된 효모 세포로부터 세포 용해질에서, GC/MS에 의해 지방족 케톤 14-헵타코사논(C27 지방족 케톤)이 확인되었다(도 14A 참조). 이는 oleA가 사카로미세스 세레비시아(S. cerevisiae)에서 발현되어 지방족 케톤을 생산할 수 있다는 것을 증명한다. 유사한 방법을 이용하여 임의의 관심 세포에서 oleA를 발현하고, 세포 용해질을 제조하고, 그 이후에 지방족 케톤의 생산을 분석할 수 있다.
본 실시예에 반영된 실험의 결과는 oleA가 사카로미세스 세레비시아(S. cerevisiae)에서 발현되어 지방족 케톤의 시험관내 생산에 이를 수 있다는 것을 증명한다.
실시예 16
본 실시예에서는 중수소화된 알데히드와 올레핀이 정제된 OleA, OleD를 내포하는 세포 용해질, 그리고 중수소화된 NADPH를 포함하는 시험관내 분석물에서 유지된다는 것을 설명한다.
OleA 단백질은 pET-21b(+)_OleA로 형질전환된 대장균(E. coli) C41(DE3)의 발현에 의해 이들 실험용으로 생산되었다. His-표식된 OleA는 실시예 10에 기술된 바와 같이 정제되었다. OleD 세포 용해질은 제조업체의 프로토콜(Novagen, CA)에 따라, Overnight Express Instant TB 배지를 이용하여 pET-21b(+)_OleD로 형질전환된 대장균(E. coli) C41(DE3)의 발효에 의해 이들 실험용으로 생산되었다. 이들 세포 용해질을 제조하는데 10 ㎖의 하룻밤 배양액이 이용되었다. 배양액은 원심분리하여 세포를 펠릿으로 농축하였다. 상층액은 제거하였다. 펠릿은 2 ㎖의 50 mM 인산나트륨 완충액(pH 7.0)에 재현탁시켰다. 세포 현탁액은 이후, 초음파처리(0.5 파워(power)에서 5초 펄스(pulse) 5회)를 이용하여 용해시켰다. 2 ㎕의 Benzonase®(Novagen, CA)를 세포 용해질에 첨가하고, 시료는 20분 동안 실온에 유지시켰다. 이러한 세포 용해질은 OleD 단백질의 공급원으로서 이용되었다.
듀테로(deutero)-NADPH는 아래의 프로토콜에 따라 제조되었다. 5 ㎎의 NADP+와 3.6 ㎎의 D-글루코오스-1-d를 2.5 ㎖의 50 mM 인산나트륨 완충액(pH 7.0)에 첨가하였다. 표지된 NADPH의 효소적 생산은 R-(4-2H)NADPH의 생산의 경우에 바실루스 메가테리움(Bacillus megaterium)(USB Corporation)으로부터, 또는 S-(4-2H)NADPH의 생산의 경우에 테르모플라스마 아키도필룸(Thermoplasma acidophilum)(Sigma)으로부터 5 단위(unit)의 글루코오스 데히드로게나아제의 부가로 시작하였다. 반응물은 37℃에서 15분 동안 배양하고, 10 KDa MWCO Amicon Ultra 원심분리기 필터(Millipore)를 이용하여 원심분리-여과하고, 드라이아이스에서 순간 동결시키고, -80℃에서 보관하였다.
시험관내 분석 반응물은 0.1 ㎖의 전체 부피에서, 0.1 mM 미리스토일 조효소 A, 10 mM MgCl2, 10 ㎕의 1/10 희석된 OleD 용해질, 50 ㎕ 듀테로-NADPH(앞서 기술된 바와 같이 제조됨), 2.1 μM OleA와 100 mM 인산염 완충액(pH 7.0)을 포함하였다. 이용된 미리스토일 조효소 A는 Sigma(M4414, St Louis MO)로부터 구입하고 0.1 M 인산염 완충액 pH 7.0에서 10 mM 저장 용액(stock solution)으로 제조하였다. 시료는 37℃에서 1시간 동안 배양하였다. 반응은 1% 아세트산/0.15% 포름산을 내포하는 500 ㎕의 에틸 아세테이트로 진정시켰다. 혼합물은 와동과 그 이후에, 원심분리로 혼합하였다. 상층(에틸 아세테이트 층)은 깨끗한 유리 튜브로 이동시키고 진공 하에 원심분리기(Vacufuge 5301, Eppendorf, Westbury, NY)에서 건조시켰다. 상기 시료는 40 ㎕의 에틸 아세테이트와 대조 스파이크로서 작용하는 10 ㎕의 0.1 ㎎/㎖ 헥사코세인 용액(에틸 아세테이트에서 제조됨)에 재현탁시키고 GC/MS로 분석하였다. 특정 탄화수소에 대하여 1 내지 10 ㎕를 분석하였다.
GC/MS에 의해 검출된 생성된 알데히드와 올레핀은 테트라데카날과 헵타코센의 이성질체이었다(도 15A-H 참조). NADPH로부터 수소화물 운반(hydride transfer)이 입체특이적(stereospecific)이기 때문에, R-(4-2H)NADPH와 S-(4-2H)NADPH 둘 모두 합성되었다. +1 단위 질량(unit mass)을 갖는 알데히드와 올레핀은 R-(4-2H)NADPH를 이용하는 경우에만 관찰되었다. 이들 알데히드와 올레핀이 표지된다는 사실은 중수소(deuterated hydrogen)가 표지된 NADPH로부터 표지된 알데히드 또는 올레핀으로 운반된다는 것을 암시한다. 이는 NADPH가 이러한 효소 반응에 이용된다는 것을 증명한다. 이러한 수소화물 운반이 입체특이적이라는 사실은 효소 반응을 암시한다.
본 실시예에 반영된 실험의 결과는 oleD가 피리딘 뉴클레오티드 산화환원효소를 인코딩한다는 것을 증명한다. 더 나아가, 이들 결과는 운반된 수소화물이 올레핀 산물 내에 존속하도록, OleD가 올레핀 생합성에서 NADPH로부터 중간물질로 수소화물 운반을 촉진한다는 것을 증명한다. OleA와 미리스토일 CoA의 존재에서 진행되는 수소화물 운반은 C1-듀테로-테트라데카날과 C14-듀테로, 델타-13, 헵타코센 둘 모두의 검출을 결과하였다.
실시예 17
본 실시예에서는 시험관내에서 지방족 올레핀을 합성하는 능력을 설명한다.
단백질 발현을 위한 프로토콜과 OleA /B/C/D 단백질의 활성을 평가하기 위한 용해질의 제조
pETDuet_OleAB와 pCOLADuet_OleCD로 형질전환된 대장균(E. coli) C41(DE3)이 4가지 Ole 단백질(OleA, OleB, OleC와 OleD)을 내포하는 세균 용해질을 산출하는데 이용되었다.
pETDuet_OleAB와 pCOLADuet_OleCD로 형질전환된 대장균(E. coli) C41(DE3) 세포는 카나마이신(50 ㎍/㎖ 최종 농도)과 카베네실린(100 ㎍/㎖ 최종 농도)을 내포하는 Luria 액체배지에서, 37℃에서 0.5-1.0의 OD600으로 성장시켰다. 배양액은 이후, 1 mM IPTG로 유도하고 37℃에서 하룻밤동안 성장시켰다. 하룻밤동안 성장된 배양액은 3000 rpm에서 20분 동안 원심분리하였다. 상층액은 폐기하였다. 펠릿은 차후 이용을 위하여 -80℃에서 동결시켰다. 10 ㎖의 유도된 하룻밤 배양액으로부터 획득된 세포 펠릿은 2 ㎖의 완충액에 재현탁시키고 초음파처리(0.5 파워(power)에서 5초 펄스(pulse) 5회)를 이용하여 용해시켰다. 초음파처리된 용해질에서, 2 ㎕의 Benzonase®(Novagen, CA)를 첨가하고, 시료는 20분 동안 실온에 유지시켰다. 이러한 용해질은 OleA, OleB, OleC와 OleD 단백질의 공급원으로서 이용되었다.
미리스토일-ACP의 제조를 위한 프로토콜
미리스토일-ACP는 약간 변형된 점을 제외하고 Rock et al., Methods Enzymol, 72: 397-403 (1981)에서 기술된 바와 같이 합성되었다. 간단히 말하면, 1-4 ㎖의 최종 부피에서, 5 mM ATP, 2 mM DTT, 2% Triton X-100, 10 mM LiCl, 160 μM 미리스트산-나트륨 염, 65 μM ACP-SH, 10 mM MgCl2, 0.1 M Tris-HCl pH 8.0과 1.5-3 ㎍/㎖ 아실-ACP 신타아제를 포함하는 반응 혼합물은 37℃에서 3시간 동안, 이후 30℃에서 하룻밤동안 배양하였다. 이용된 아실-ACP 신타아제는 Invitrogen으로부터 구입하였다. 반응 혼합물은 3 부피(volume)의 물로 희석하고, pH는 아세트산으로 6.0으로 적정하였다. 생성 용액은 HiTrap DEAE FF 5㎖ 칼럼(GE Healthcare)에 가하였다. 상기 칼럼은 3 칼럼 부피(column volume)의 10 mM bis-Tris-HCl, pH 6.0로 세척하여 대부분의 Triton X-100을 제거하였다. 남아있는 Triton X-100과 유리 지방산은 3 칼럼 부피의 80% 2-프로판올로 칼럼을 용리함으로써 제거하였다. 2-프로판올은 3 칼럼 부피의 10 mM bis-Tris-HCl, pH 6.0으로 제거하였다. 미리스토일-ACP와 반응되지 않은 ACP-SH는 10 mM bis-Tris-HCl, pH 6.0에서 10 ㎖의 0.6 M LiCl로 칼럼으로부터 용리하였다. 미리스토일-ACP를 내포하는 용출물(eluate)은 50 mM 인산나트륨 완충액 pH 7.0으로 완충액 교환하고, MWCO 3 kDa 농축기(concentrator)(Millipore)를 이용하여 1 ㎖로 농축하였다. 미리스토일-ACP 농도는 2 단계로, Bradford 분석(BioRad)과 NuPAGE 12% Bis-Tris SDS-PAGE 겔(Invitrogen)에서 음영계측 분석(densitometry analysis)을 이용하여 측정하였다: 첫째, C14-ACP/ACP-SH 분취물의 전체 단백질 농도는 Bradford 분석(BioRad 단백질 분석)으로 측정하였다; 둘째, C14-ACP 농도는 음영계측 분석에 의해, SDS-PAGE에 기초된 전체 단백질 농도의 비율로서 계산하였다. C14-ACP는 -2O℃에서 5OmM Na-인산염 완충액, pH 7.0에 보관하였는데, 최대 3개월 동안 안정하였다.
올레핀을 생산하는 방법
pETDuetOleAOleB와 pCOLADuetOleCOleD로 형질전환된 대장균(E. coli) C41(DE3)은 앞서 기술된 바와 같이 OleA, OleB, OleC와 OleD 단백질을 내포하는 세포 용해질을 산출하는데 이용되었다. 시험관내 분석 반응물은 1 ㎖의 전체 부피에서, 0.1 mM 미리스토일 조효소 A 또는 0.1 mM 미리스토일-ACP, 10 mM MgCl2, pETDuetOleAOleB와 pCOLADuetOleCOleD로 형질전환된 대장균(E. coli) C41(DE3)로부터 360 ㎕의 세포 용해질, 1 mM NADPH(Sigma, MO), 1 mM ATP(Sigma, MO), 1 mM HSCoA(Sigma, MO)와 100 mM 인산염 완충액(pH 7.0)을 포함하였다. 이용된 미리스토일 조효소 A는 Sigma(M4414, St Louis MO)로부터 구입하고 0.1 M 인산염 완충액 pH 7.0에서 10 mM 저장 용액(stock solution)으로 제조하였다. 시료는 37℃에서 1시간 동안 배양하였다. 반응은 1% 아세트산/0.1% 포름산을 내포하는 5 ㎖의 에틸 아세테이트로 진정시켰다. 혼합물은 와동과 그 이후에, 원심분리로 혼합하였다. 4 ㎖의 상층(에틸 아세테이트 층)은 깨끗한 유리 튜브로 이동시키고 진공 하에 원심분리기(Vacufuge 5301, Eppendorf, Westbury, NY)에서 건조시켰다. 상기 시료는 40 ㎕의 에틸 아세테이트와 대조 스파이크로서 작용하는 10 ㎕의 0.1 ㎎/㎖ 헥사코세인 용액(에틸 아세테이트에서 제조됨)에 재현탁시키고 GC/MS로 분석하였다. 특정 탄화수소에 대하여 1 ㎕를 분석하였다.
GC/MS에 의해 검출된 생성된 올레핀은 C27:1, C27:2와 C27:3이었다(도 16A-C 참조). 표 28에서는 C14-CoA 또는 C14-ACP의 존재에서 pETDuetOleAOleB와 pCOLADuetOleCOleD로 형질전환된 대장균(E. coli) C41(DE3)로부터 세포 용해질에 의해 생산된 C27:1 올레핀의 비율을 열거한다. C27:1 올레핀의 비율은 [C27:1 피크 면적(peak area)/(C27:1 피크 면적 + C27:2 피크 면적 + C27:3 피크 면적)] x 100으로 계산되었다. 표 28에 열거된 결과는 pETDuetOleAOleB와 pCOLADuetOleCOleD로 형질전환된 대장균(E. coli) C41(DE3)로부터 세포 용해질에 C14-CoA 또는 C14-ACP의 부가가 C27:1 올레핀의 양에서 증가로 이어진다는 것을 암시한다. 이는 용해질 내에 존재하는 pETDuetOleAOleB와 pCOLADuetOleCOleD로 형질전환된 대장균(E. coli) C41(DE3)이 C14-CoA 또는 C14-ACP를 이용하여 C27:1-올레핀을 형성할 수 있다는 것을 암시한다.
본 실시예에 반영된 이들 실험의 결과는 OleA, OleB, OleC와 OleD와 공동으로 미리스토일-ACP 또는 미리스토일 조효소 A를 포함하는 시험관내 분석물이 올레핀을 합성하는데 이용될 수 있다는 것을 증명한다.
실시예 18
본 실시예에서는 OleA, OleB, OleC와 OleD 단백질 서열이 탄화수소를 자연적으로 생산하는 생물체를 확인하는데 이용될 수 있다는 것을 설명한다.
OleA, OleB, OleC와 OleD 단백질 집단에 속하는 단백질 서열을 확인하기 위하여 pBLAST 생물정보학 프로그램이 이용되었다. 서로 집합된 4가지 Ole 단백질 서열을 모두 내포하는 소수의 생물체가 확인되었다(예로써, 표 1 참조). 이들 생물체 중에서, 아래의 4가지 생물체는 기존 문헌에서, 본 명세서에 기술된 유형의 올레핀을 생산하는 것으로 밝혀졌다: 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 키네오코커스 라디오톨레란스(Kineococcus radiotolerans), 클로로플렉서스(Chloroflexus) 종들, 그리고 최근에 염기서열분석된 미크로코커스 루테우스(Micrococcus luteus)를 비롯한 다양한 미크로코커스(Micrococcus) 종들(Tornabene et al., 상기, Suen et al., 상기, Morrison et al., 상기; van der Meer et al., 상기; Albro et al., 상기; Philips et al., 상기). OleA, OleB, OleC와 OleD를 내포하는 다른 생물체가 올레핀을 자연적으로 생산하는 지를 확증하기 위하여, 표 1로부터 아스로박터 아우레스켄스(Arthrobacter aurescens) TC1(ATCC BAA- 1386)이 올레핀 생산을 조사하는데 선택되었다. 아스로박터 아우레스켄스(Arthrobacter aurescens) TC1은 기존 문헌에서, 올레핀을 생산하는 것으로 보고되지 않았다.
아스로박터 아우레스켄스(Arthrobacter aurescens) TC1은 500 ㎖ 플라스크 내에서 ℓ(liter)당 10 g 카세인 펩톤[(casein peptone)(트립신 절단(tryptic digest)], 5 g 글루코오스, 5 g 효모 추출물과 5 g NaCl로 구성되는 100 ㎖의 코리네박테리움(Corynebacterium) 액체배지에서, 30℃에서 48시간 동안 교반하면서 성장시켰다. 48시간후, 변형된 추출 방법 1에 따라서 5 ㎖의 액체배지를 추출하였다. 구체적으로, 세포 배양액의 최초 펠리팅(pelleting) 이후에, 펠릿은 1 ㎖의 물에 재현탁시키고 재원심분리하여 남아있는 배양 액체배지를 제거하였다. 최종 펠릿은 100 ㎕의 물에 재현탁시켰다. 추출 방법 1의 나머지 단계를 수행하였다(실시예 1 참조). 추출물은 검출 방법 1을 이용한 GC/MS로 분석하였다. GC/MS에 의해 검출된 올레핀은 C29 단일-불포화 올레핀이었다(도 19A-B 참조).
본 실시예에 반영된 결과는 OleA, OleB, OleC와 OleD에 대한 단백질 서열을 내포하는 생물체가 올레핀을 생산한다는 것을 증명한다. 이에 더하여, 본 실시예에서는 단백질 서열 내에 OleA, OleB, OleC와 OleD를 내포하는 생물체를 확인함으로써, 올레핀 생산 생물체를 확인하는데 생물정보학이 이용될 수 있다는 것을 증명한다. 더욱 구체적으로, 본 실시예에서는 OleA, OleB, OleC와 OleD 단백질 서열을 보유하는 아스로박터 아우레스켄스(Arthrobacter aurescens) TC1이 C29 단일-불포화 올레핀을 생산한다는 것을 증명한다.
실시예 19
본 실시예에서는 생물학적으로 기초된 올레핀이 석유 기초된 올레핀과 구별된다는 것을 설명한다. 특히, 본 실시예에서는 oleA, oleB, oleC와 oleD 유전자를 발현하는 생물체, 이를테면, 대장균(E. coli)에 의해 생산된 올레핀이 석유 기초된 올레핀으로부터 구별될 수 있음을 설명한다.
대장균(E. coli) C41(DE3); pETDuet-1_OleAB; pCOLADuet-1_OleCD의 발현에 의해 생산되고 정제된 생물학적으로 기초된 올레핀은 표준 탄소 연대측정(carbon dating) 기술을 이용하여 석유 기초된 올레핀, (Z)-9-트리코센(97%, Sigma-Aldrich, CAS 번호: 27519-02-4)과 비교하였다. 시료는 조사를 위하여 Beta Analytic, Inc.(Miami, FL, USA)에 보냈다. 이들 시료의 생물학적으로 기초된 탄소 함량은 ASTM D6866에 기초된 가속기 질량 분석(Accelerator Mass Spectrometry, AMS)을 이용하여 측정하였다. AMS는 시료 분말로부터 유래된 흑연(graphite)에서 12C와 14C에 대한 13C의 탄소 동위원소 비율(carbon isotope ratio)을 측정한다. 이후, 이들 시료의 생물학적으로 기초된 탄소 함량을 12C에 대한 13C의 탄소 동위원소 비율과 현존하는 14C의 양으로부터 계산하였다.
분석된 올레핀 시료는 아래의 방법을 이용하여 생산하고 정제하였다. 대장균(E. coli) C41(DE3); pETDuet-1_OleAB; pCOLADuet-1_OleCD는 100 ㎎/ℓ 카베니실린과 50 ㎎/ℓ 카나마이신으로 보충된 5 ㎖의 LB 배지에서 12시간 동안 성장시켰다. 이러한 12시간 배양액은 3 g/ℓ KH2PO4, 6.62 g/ℓ K2HPO4, 4 g/ℓ (NH4)2SO4, 0.15 g/ℓ MgSO4, 5 g/ℓ 글루코오스(덱스트로스 DX0145-5 EMD Chemicals, Inc. NJ), 1.25 ㎖/ℓ의 미량 미네랄(trace mineral) 용액과 1.25 ㎖/ℓ의 미량 비타민 용액을 포함하는 200 ㎖의 F1 교반 플라스크 배지(shake flask media)로 구성되고 100 ㎎/ℓ 카베니실린과 50 ㎎/ℓ 카나마이신으로 보충된 더욱 큰 배양액에 접종하였다. 미량 미네랄 용액은 ℓ당 27 g FeCl3ㆍ6H2O, 2 g ZnCl2ㆍ4H2O, 2 g CaCl2ㆍ6H2O, 2 g Na2MoO4ㆍ2H2O, 1.9 g CuSO4ㆍ5H2O, 0.5 g H3BO3과 100 ㎖ 농축된 HCl을 포함하였다. 미량 비타민 용액은 ℓ당 0.42 g 리보플라빈(riboflavin), 5.4 g 판토텐산(pantothenic acid), 6 g 니아신(niacin), 1.4 g 피리독신(pyridoxine), 0.06 g 비오틴(biotin)과 0.04 g 엽산(folic acid)을 포함하였다. 50 ㎖의 접종 배양액(seed culture)을 이용하여, 초기에 1 ℓ의 멸균된 F1 발효 배지를 내포하는 2 ℓ Biostat Aplus 생물반응기(Sartorius BBI)를 접종하였다. 멸균된 F1 발효 배지는 1.5 g/ℓ KH2PO4, 4.34 g/ℓ K2HPO4 3수화물(trihydrate), 4 g/ℓ (NH4)2SO4, 0.150 g/ℓ MgSO4 7수화물(heptahydrate), 5 g/ℓ 무균 여과된 글루코오스(덱스트로스 EMD Chemicals, Inc. NJ), 1.25 ㎖/ℓ의 미량 미네랄 용액, 1.25 ㎖/ℓ의 미량 비타민 용액, 그리고 상기 교반 플라스크에서 이용된 것과 동일한 농도에서 항생제를 포함하였다. 배양액의 pH는 1 M H2SO4와 30% w/v NH4OH를 이용하여 7.2에 유지시켰다. 온도는 37℃에 유지시키고, 환기 속도(aeration rate)는 2 lpm(2 v/v/m)에 유지시키고, 그리고 용존 산소 농도(dissolved oxygen tension)는 DO 컨트롤러(controller)로 폭포처럼 떨어지는 휘저음 루프(agitation loop)를 이용하여 30%의 포화(상태)에 유지시켰다. 기포발생(foaming)은 Antifoam 204(Sigma-Aldrich St. Louis, MO)의 가압멸균 용액의 자동화된 첨가로 제어하였다.
60 g/ℓ (NH4)2SO4, 3.9 g/ℓ MgSO4 7수화물(heptahydrate), 430 g/ℓ 글루코오스, 10 ㎖/ℓ의 미량 미네랄 용액과 10 ㎖/ℓ의 비타민 용액으로 구성되는 영양 배지(nutrient feed)를 호기성 발효 조건 하에 48시간 동안 발효기(fermentor)에 제공하였다. 발효를 위한 글루코오스 당 공급원은 옥수수로부터 획득되었다.
최초 배지에서 글루코오스가 고갈될 때(접종후 대략 6시간 시점), 60 g/ℓ (NH4)2SO4, 3.9 g/ℓ MgSO4 7수화물, 430 g/ℓ 글루코오스, 10 ㎖/ℓ의 미량 미네랄 용액과 10 ㎖/ℓ의 비타민 용액으로 구성되는 영양 배지를 제공하였다. 이러한 영양 배지는 배지 내에서 10 g/ℓ 이하의 잔류 글루코오스 수준을 유지하기 위하여 발효 동안 점진적으로 증가시키거나 감소시켰다. 생물반응기 내에서 올레핀의 생산은 배양액이 1 mM의 최종 농도로 1M IPTG 저장 용액의 첨가에 의해 30 AU의 OD60O을 달성할 때(접종후 대략 8 - 9시간 시점) 유도되었다. 발효 온도 역시 유도 시점에 3O℃로 낮추었다. 생물반응기는 유도후 대략 48시간 시점에 수확하였다.
48시간후, 발효 배양액은 3500 rpm에서 20분 동안 원심분리하였다(회전자 SX-4750A가 구비된 Allegra X-15R 원심분리기, Beckman Coulter, Fullerton, CA). 세포 펠릿은 50 ㎖의 무균 증류수(sterile distilled water)에서 재현탁시켰다. 100 ㎖의 메탄올을 시료에 첨가하고, 상기 시료는 이후, 초음파처리 수조(sonicating water bath)에서 60분 동안 초음파처리하였다. 혼합물은 1 ℓ 분리 깔때기(separation funnel)로 이동시키고, 여기서 n-헥산을 750 ㎖의 최종 부피로 첨가하였다. 시료는 가볍게 흔듦으로써 충분히 혼합하고, 이후 혼합물은 가라앉혀 수층(aqueous layer)으로부터 헥산 층(hexane layer)을 분리하였다. 이중층(bilayer)이 형성되면, 아래쪽 수층은 분리 채널(separation funnel) 밖으로 옮겼다. Na2SO4를 남아있는 유기 층(organic layer)에 첨가하여 유기 상 내에 과량의 H2O를 제거하였다. 유기 층은 이후, 진공을 가하지 않으면서 Whatman #4 150 ㎜ 필터를 통하여 2회 여과하였다. 2회 여과된 유기 상은 증류 칼럼(distillation column)에 연결된 원형-바닥 플라스크(round-bottom flask) 내로 이동시켰다. 헥산과 아세톤은 56℃와 그 이후에, 66-68℃로 설정된 온도에서 증류로 제거하였다. 남아있는 시료는 검은색이었다. 시료를 더욱 정제하기 위하여, 상기 시료는 200 ㎖ 실리카 겔 60[입자 크기(particle size) 0.063-0.300 ㎜, 70-230 메시(mesh) ASTM] 칼럼을 통하여 여과하였다. 시료는 헥산으로 용리에 의해 칼럼으로부터 제거하였다. 헥산은 실온에서 회전 증발기(rotary evaporator)로 올레핀 포함 용리액(eluant)으로부터 제거하였다. 최종 정제 과정에서 마그네졸(magnesol) D-sol(Dallas Group of American, Inc)을 이용하였다. 시료는 8 ㎖의 최종 부피로 메틸 tert-부틸 에테르(MTBE)에 재현탁시켰다. 마그네졸은 10:1 비율의 마그네졸 vs. 시료(w/v)로 시료에 첨가하였다. 시료-마그네졸 혼합물은 회전 교반기 상에서 37℃에서 1시간 동안 혼합하였다. 혼합물은 0.2 ㎛ PTFE 필터를 통하여 20 ㎖ 신틸레이션 바이알(scintillation vial) 내로 여과하였다. 남아있는 고체는 2.5 ㎖ MTBE로 세척하였다. 세척액과 여과된 혼합물은 신틸레이션 바이알에서 병합하였다. MTBE는 실온에서 화학 가스 후드(chemical fume hood)에서 증발시켰다.
14C는 ASTM D6866 방법 B를 이용하여, Beta Analytic, Inc.에서 AMS에 의해 측정되었다. 생물학적으로 기초된 탄소 함량은 현대 참고 표준(modern reference standard)의 14C에 대한 시료에서 14C의 비율을 도출함으로써 획득하였다. 이러한 비율은 단위 ‘pMC’(현대 탄소 비율, percent modern carbon)를 갖는 백분율로서 보고된다.
방사성탄소 연대측정(radiocarbon dating)에 이용되는 현대 참고 표준은 NIST(National Institute of Standards and Technology) 표준인데, 공지된 방사성탄소 함량은 대략 AD 1950(년)에 대응한다. AD 1950이 선택된 이유는 AD 1950이 각 검사에서 대량의 과도한 14C가 대기로 도입되었던 열핵무기(thermo-nuclear weapon) 실험 이전의 시기를 대표하기 때문이다[과도한 14C는 “폭탄 탄소(bomb carbon)”로 알려져 있다]. 14C 연대를 이용하는 고고학자와 지질학자에게, AD 1950은 “0년(zero year)”에 해당한다. 이는 또한, 100 pMC를 나타낸다. 대기에서 “폭탄 탄소”는 열핵무기의 피크 시점인 1963년에 정상 수준의 거의 2배에 육박하였다. 대기 내에서 폭탄 탄소의 분포는 출현 이후로 거의 동일하였고, AD 1950 이후로 생존하는 식물과 동물의 경우에 100 pMC 초과의 수치를 보인다. 이는 시간의 흐름에 따라서 점진적으로 감소하고 있는데, 현재 수치는 거의 107.5 pMC이다. 이는 새로운 바이오매스 물질, 예를 들면, 옥수수가 107.5 pMC에 근접하는 14C 시그너처(signature)을 갖는다는 것을 의미한다. 석유 기초된 화합물은 0의 pMC 수치를 가질 것이다. 화석 탄소를 현재의 탄소와 병합하면, 현재의 pMC 함량이 희석될 것이다. 107.5 pMC가 현재의 바이오매스 물질의 14C 함량을 나타내고 0 pMC가 석유 기초된 산물의 14C 함량을 나타낸다고 가정하면, 상기 물질에 대한 측정된 pMC 수치는 이들 2가지 성분 유형(component type)의 비율을 반영할 것이다. 가령, 현재의 콩으로부터 100% 유래된 물질은 107.5 pMC에 근접하는 방사성탄소 시그너처(radiocarbon signature)을 제공할 것이다. 상기 물질이 석유 기초된 산물로 50% 희석되면, 이는 대략 54 pMC의 방사성탄소 시그너처를 제공할 것이다.
생물학적으로 기초된 탄소 함량은 100%가 107.5 pMC에 상당하고 0%가 0 pMC에 상당한 것으로 지정함으로써 도출된다. 가령, 99 pMC로 측정된 시료는 93%에 상당하는 생물학적으로 기초된 탄소 함량을 제공할 것이다. 분석된 물질 내에서 모든 성분이 현재의 생물학적 물질 또는 석유 기초된 물질로부터 기원한다는 가정 하에, 이러한 수치는 평균 생물학적으로 기초된 탄소 결과로서 지칭된다.
소정의 생물학적으로 유래된 물질에서 안정 탄소 동위원소 비율(13C/12C)은 이산화탄소가 고정되는 시점에서 대기 이산화탄소에서 13C/12C 비율의 결과이다. 이는 또한, 식물 고정 이산화탄소(plant fixing carbon dioxide)의 정확한 대사 경로(metabolic pathway)를 반영한다. 13C/12C 비율은 통상적으로, 아래와 같이 계산되는 δ13C로 표시된다:
δ13C(‰) = [(13C/12C)시료 - (13C/12C)표준]/(13C/12C)표준 x 1000
석유와 C4 식물(옥수수, 수수 등)의 δ13C는 유사한 범위(-7 내지 -13 ppt)를 갖는 반면, C3 식물(밀, 귀리, 쌀 등)의 13C/12C는 - 19 내지 -27 ppt 범위에 속한다(예로써, Stuiver et al., 상기; Gupta, et al., Radiocarbon dating practices at ANU. Handbook, Radiocarbon Dating Laboratory, Research School of Pacific Studies, ANU, Canberra (1985) 참조). C4와 C3 식물에 대한 δ13C 수치에서 차이는 각 식물의 상이한 광합성 주기(photosynthetic cycle)에 기인한다.
생물학적으로 기초된 올레핀 산물과 석유 기초된 9-트리코센의 pMC와 δ13C의 수치는 표 29에 열거된다.
14C 결과에 기초하여, 대장균(E. coli)에 의해 생산된 생물학적으로 기초된 올레핀은 생물학적으로 기초된 탄소로부터 적어도 88% 유래된 탄소 함량을 갖는다. 정제 동안 이용된 석유 기초된 산물인 잔류 MTBE가 올레핀 시료 내에서 생물학적으로 기초된 탄소의 함량을 낮추었을 가능성도 있다. 게다가, 생물학적으로 기초된 올레핀 산물의 δ13C 수치는 올레핀 산물, 그리고 여기에 내포된 탄소가 일차적으로, 생물학적 공급원으로부터 유래된다는 부가적인 증거를 제공한다.
본 실시예에 반영된 이들 실험의 결과는 생물학적으로 기초된 탄화수소가 석유 기초된 탄화수소와 구별된다는 것을 증명한다. 특히, 본 실시예에서는 oleA, oleB, oleC와 oleD 유전자를 발현하는 생물체, 이를테면, 대장균(E. coli)에 의해 생산된 올레핀이 석유 기초된 올레핀과 구별될 수 있다는 것을 증명한다.
본 명세서에 언급된 간행물, 특허 출원과 특허를 비롯한 모든 참고문헌은 각 참고문헌이 본 명세서에서 순전히 참조로서 편입되는 것으로 구체적이고 개별적으로 지시된 것처럼 본 명세서에서 참조로서 편입된다.
본 발명(특히, 아래의 특허청구범위)을 기술하는 문맥에서 단수 표현과 이들에 유사한 참고물(referent)의 이용은 본 명세서에서 달리 명시되거나, 또는 문맥에 의해 명백하게 모순되지 않는 경우에, 단수와 복수를 모두 포괄하는 것으로 해석된다. 용어 “포함하는”, “보유하는”과 “내포하는”은 달리 명시되지 않는 경우에, 제한 없는 용어(open-ended term)(즉, “포함하지만 국한되지 않는”)로서 해석된다. 본 명세서에서 수치 범위에 관한 언급은 본 명세서에서 달리 명시되지 않으면, 상기 범위 내에 속하는 각 독립 수치를 개별적으로 지칭하는 속기 방법인 것으로 의도되고, 각 독립 수치는 본 명세서에서 개별적으로 언급된 것처럼 명세서에 통합된다. 본 명세서에 기술된 모든 방법은 본 명세서에서 달리 명시되거나, 또는 문맥에 의해 명백하게 모순되지 않는 경우에, 임의의 적절한 순서로 수행될 수 있다. 본 명세서에 제시된 임의의 실례, 또는 전형적인 언어(가령, “이를테면”)의 이용은 본 발명을 더욱 상세하게 설명하는 것으로 의도되고, 달리 청구되지 않으면 본 발명의 범위를 제한하지 않는다. 명세서 내에서 어떤 언어도 임의의 청구되지 않은 요소를 본 발명의 실시에 필수적인 것으로 지시하는 것으로 해석되지 않는다.
명세서 전반에서, 단축된 유전자 명칭 또는 폴리펩티드 명칭이 언급되지만, 이런 단축된 유전자 또는 폴리펩티드 명칭은 유전자 또는 폴리펩티드의 속(genus)을 대표하는 것으로 간주된다. 유전자 명칭에는 동일한 폴리펩티드와 동일한 생리학적 기능을 갖는 상동성 폴리펩티드를 인코딩하는 모든 유전자가 포함된다. 폴리펩티드 명칭에는 동일한 활성을 갖는(가령, 동일한 기본적 화학 반응을 촉진하는) 모든 폴리펩티드가 포함된다.
본 명세서에서 인용된 수탁 번호(accession number)는 National Institute of Health, U.S.A에 의해 관리되는 NCBI 데이터베이스(National Center for Biotechnology Information)로부터 유래된다. 이들 수탁 번호는 2007년 4월 15일자 데이터베이스에서 제공된다.
EC 번호는 Nomenclature Committee of the International Union of Biochemistry and Molecular Biology(NC-IUBMB)(http://www.chem.qmul.ac.uk/iubmb/enzyme/)에 의해 확립된다. 본 명세서에 인용된 EC 번호는 University of Tokyo에 의해 부분적으로 후원되는, Kyoto Encyclopedia of Genes and Genomics에 의해 관리되는 KEGG 리간드 데이터베이스로부터 유래된다. 이들 EC 번호는 2007년 4월의 데이터베이스에서 제공된다.
본 발명을 수행하기 위하여 본 발명자들에게 공지된 최적 양식을 비롯한 본 발명의 바람직한 구체예가 본 명세서에 기술된다. 이들 바람직한 구체예의 변이는 상기한 명세서를 읽어본 당업자에게 명백할 것이다. 본 발명자들은 당업자가 이런 변이를 적절하게 이용할 수 있을 것으로 예상하고, 본 발명이 본 명세서에 구체적으로 기술된 바와 다르게 실시될 수 있도록 할 것이다. 따라서 본 발명은 준거법(applicable law)에 의해 허용되는, 하기에 첨부된 특허청구범위에서 언급된 요부(subject matter)의 모든 변형과 균등물을 포괄한다. 게다가, 모든 가능한 변이에서 앞서 기술된 요소의 임의의 조합은 본 명세서에서 달리 명시되거나, 또는 문맥에 의해 명백하게 모순되지 않는 경우에, 본 발명에 포함된다.