RNA 가이드 및 표적 서열 (RNA Guides and Target Sequences)
본 발명의 Cas 단백질은, 상승된 온도에서 표적 핵산의 서열-특이적 결합, 절단, 태깅 (tagging), 표지 또는 변형을 가능하게 한다. 표적 핵산은 DNA (단일-가닥 또는 이중-가닥), RNA 또는 합성 핵산일 수 있다. 본 발명의 특히 유용한 적용은, 게놈 DNA의 표적화된 서열에 상보적으로 결합하는 하나 이상의 가이드 RNA (gRNA)와의 복합체에서 본 발명의 하나 이상의 Cas 단백질에 의한 게놈 DNA의 서열-특이적 표적화 및 변형이다. 결과적으로, 표적 핵산은, 바람직하게는, 이중-가닥 DNA이다. 이러한 표적화는 시험관 내 또는 생체 내에서 수행될 수 있다. 바람직하게는, 이러한 표적화는 생체 내에서 수행된다. 이러한 방식에서, 본 발명의 Cas 단백질은, 세포의 게놈 DNA에 위치된 특이적 DNA 서열을 표적화하고 변형시키는데 사용될 수 있다. Cas 시스템은, 다른 유기체에서 및/또는 다른 유기체의 다양한 세포 타입에서 게놈을 변형시키는데 사용될 수 있는 것으로 예상된다.
표적화 RNA 분자로 또한 불리는, gRNA는, 폴리뉴클레오티드 표적 가닥 상에 표적 핵산 서열을 인식한다. RNA 분자는 이중 가닥 표적 폴리뉴클레오티드에서 표적 서열을 인식하도록 디자인될 수 있으며, 여기서, 비-표적 가닥은 프로토스페이서 서열의 3' 말단에 바로 인접한 프로토스페이서 인근 모티프 (PAM) 서열을 포함한다. 본 발명의 Cas 단백질 및 폴리펩티드와 최적의 방식으로 작용하는 PAM 서열은 여기에 개시된다. 이들 PAM 서열에 대한 지식으로, gRNA는, 본 발명의 온도 범위 및 증가된 온도에 걸쳐서 본 발명의 Cas 단백질 및 폴리펩티드와 함께 사용하기 위해 디자인될 수 있다.
따라서, 본 발명은, 전술된 바와 같은 본 발명의 Cas 단백질 또는 폴리펩티드를 포함하고, 및 표적 폴리뉴클레오티드의 특정 뉴클레오티드 서열을 인지한다는 점에서 표적화 기능을 갖는 적어도 하나의 RNA 분자를 더욱 포함하는, 리보핵산 단백질 복합체를 제공한다. 본 발명은 또한 표적 핵산 가닥을 결합, 절단, 표지 또는 변형시키기 위한 적어도 하나의 표적화 RNA 분자 및 Cas 단백질 또는 폴리펩티드의 사용, 및 본 발명의 리보핵산 단백질 또는 핵산단백질을 사용하여 표적 핵산 가닥에서 표적 핵산 서열을 결합, 절단, 표지 또는 변형시키는 방법, 뿐만 아니라 Cas 단백질 또는 폴리펩티드 및 표적화 RNA 분자를 갖는 형질전환된 비-인간 세포을 제공한다. 상기 표적 폴리뉴클레오티드는, 여기에 제공된 PAM 서열에 따라, 프로토스페이서 서열의 3' 말단에 바로 인접한 한정된 PAM 서열을 더욱 포함할 수 있다. 상기 PAM 서열은 길이가 6, 7 또는 8개의 핵산, 또는 그 이상, 바람직하게는, 길이가 8개의 핵산일 수 있다. 바람직하게는, RNA 분자는, 단일-가닥 RNA 분자, 예를 들어, CRISPR RNA (crRNA)이며, 및 예를 들어, tracrRNA와 혼성화 (hybridization)에 의해 결합된다. 상기 표적화 RNA는 crRNA 및 tracrRNA의 키메라 (chimera)일 수 있다. 전술된 RNA 분자는, 표적 뉴클레오티드 서열과 적어도 90%의 동일성 또는 상보성 (complementarity)의 리보뉴클레오티드 서열을 가질 수 있다. 선택적으로, RNA 분자는, 표적 뉴클레오티드 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97% 적어도 98%, 적어도 99% 또는 100% 동일성 또는 상보성을 갖는다. 바람직한 표적 뉴클레오티드 서열은 DNA이다.
바람직한 관점에서, 본 발명은 전술된 바와 같은 리보핵산 단백질 복합체를 제공하며, 여기서, 적어도 하나의 표적화 RNA 분자는, 이의 길이를 따라 표적 DNA 서열에 실질적으로 상보적이다.
비-표적 가닥 상에 표적 서열 및 PAM 서열을 포함하는, 표적 폴리뉴클레오티드가 본 발명의 핵산단백질 복합체와 결합하고 및 핵산단백질 복합체의 일부를 형성할 수 있도록, 표적화 RNA 분자는 핵산단백질 복합체 내의 표적 서열에 화합되거나 또는 결합될 수 있다.
따라서, 본 발명의 Cas 단백질과 결합하는 RNA 가이드의 서열의 변경 (Alteration)은, Cas 단백질이 가이드 RNA에 상보적인 부위에서 이중-가닥 DNA를 표지하거나 또는 절단하도록 프로그램되는 것을 가능하게 한다.
바람직하게는, 본 발명의 리보핵산 단백질 복합체에서 적어도 하나의 표적화 RNA 분자의 길이는, 35 내지 135 잔기의 범위, 선택적으로 35 내지 134 잔기, 35 내지 133 잔기, 35 내지 132 잔기, 35 내지 131 잔기, 35 내지 130 잔기, 35 내지 129 잔기, 35 내지 128 잔기, 35 내지 127 잔기, 35 내지 126 잔기, 35 내지 125 잔기, 35 내지 124 잔기, 35 내지 123 잔기, 35 내지 122 잔기, 35 내지 121 잔기, 35 내지 120 잔기, 35 내지 119 잔기, 35 내지 118 잔기, 35 내지 117 잔기, 35 내지 116 잔기, 35 내지 115 잔기, 35 내지 114 잔기, 35 내지 113 잔기, 35 내지 112 잔기, 35 내지 111 잔기, 35 내지 100 잔기, 35 내지 109 잔기, 35 내지 108 잔기, 35 내지 107 잔기, 35 내지 106 잔기, 35 내지 105 잔기, 35 내지 104 잔기, 35 내지 103 잔기, 35 내지 102 잔기, 35 내지 101 잔기, 35 내지 100 잔기, 35 내지 99 잔기, 35 내지 98 잔기, 35 내지 97 잔기, 35 내지 96 잔기, 35 내지 95 잔기, 35 내지 94 잔기, 35 내지 93 잔기, 35 내지 92 잔기, 35 내지 91 잔기, 35 내지 90 잔기, 35 내지 89 잔기, 35 내지 88 잔기, 35 내지 87 잔기, 35 내지 86 잔기, 35 내지 85 잔기, 35 내지 84 잔기, 35 내지 83 잔기, 35 내지 82 잔기, 35 내지 81 잔기, 35 내지 80 잔기, 35 내지 79 잔기, 35 내지 78 잔기, 35 내지 77 잔기, 35 내지 76 잔기, 35 내지 75 잔기, 35 내지 74 잔기, 35 내지 73 잔기, 35 내지 72 잔기, 35 내지 71 잔기, 35 내지 70 잔기, 35 내지 69 잔기, 35 내지 68 잔기, 35 내지 67 잔기, 35 내지 66 잔기, 35 내지 65 잔기, 35 내지 64 잔기, 35 내지 63 잔기, 35 내지 62 잔기, 35 내지 61 잔기, 35 내지 60 잔기, 35 내지 59 잔기, 35 내지 58 잔기, 35 내지 57 잔기, 35 내지 56 잔기, 35 내지 55 잔기, 35 내지 54 잔기, 35 내지 53 잔기, 35 내지 52 잔기, 35 내지 51 잔기, 35 내지 50 잔기, 35 내지 49 잔기, 35 내지 48 잔기, 35 내지 47 잔기, 35 내지 46 잔기, 35 내지 45 잔기, 35 내지 44 잔기, 35 내지 43 잔기, 35 내지 42 잔기, 35 내지 41 잔기, 35 내지 40 잔기, 35 내지 39 잔기, 35 내지 38 잔기, 35 내지 37 잔기, 35 내지 36 잔기의 범위 또는 35 잔기이다. 바람직하게는, 적어도 하나의 RNA 분자의 길이는, 36 내지 174 잔기, 37 내지 173 잔기, 38 내지 172 잔기, 39 내지 171 잔기, 40 내지 170 잔기, 41 내지 169 잔기, 42 내지 168 잔기, 43 내지 167 잔기, 44 내지 166 잔기, 45 내지 165 잔기, 46 내지 164 잔기, 47 내지 163 잔기, 48 내지 162 잔기, 49 내지 161 잔기, 50 내지 160 잔기, 51 내지 159 잔기, 52 내지 158 잔기, 53 내지 157 잔기, 54 내지 156 잔기, 36 내지 74 잔기, 37 내지 73 잔기, 38 내지 72 잔기, 39 내지 71 잔기, 40 내지 70 잔기, 41 내지 69 잔기, 42 내지 68 잔기, 43 내지 67 잔기, 44 내지 66 잔기, 45 내지 65 잔기, 46 내지 64 잔기, 47 내지 63 잔기, 48 내지 62 잔기, 49 내지 61 잔기, 50 내지 60 잔기, 51 내지 59 잔기, 52 내지 58 잔기, 53 내지 57 잔기, 54 내지 56 잔기의 범위이다.
바람직한 관점에서, 본 발명은 리보핵산 단백질 복합체를 제공하며, 여기서, 적어도 하나의 RNA 분자의 상보적 부분은 길이가 적어도 30 잔기이다. 선택적으로, 적어도 하나의 RNA 분자의 상보적 부분은, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74 또는 75 잔기 길이일 수 있다.
표적화 RNA 분자는, 바람직하게는, 표적 핵산 서열에 대해 높은 특이성 및 친화성을 요구할 것이다. 1 μM 내지 1 pM, 바람직하게는, 1 nM 내지 1 pM; 좀 더 바람직하게는, 1 내지 100pM 범위의 해리 상수 (Kd)는, 비변성 겔 전기영동 (native gel electrophoresis), 또는 선택적으로 등온 적정 열량계, 표면 플라스몬 공명, 또는 형광계 적정 방법에 의해 결정될 수 있음에 따라 바람직하다. 친화도 (Affinity)는, 겔 지연 분석 (gel retardation assay)으로 또한 불리는, 전기 이동성 교대 분석 (Electromoretic mobility shift assay, EMSA)을 사용하여 결정될 수 있다 (Semenova E et al. (2011) PNAS 108: 10098-10103 참조).
표적화 RNA 분자는, 바람직하게는, 원핵생물 내에 자연물 (nature)로부터 CRISPR RNA (crRNA) 분자로 알려진 것으로 모델링된다. crRNA 분자의 구조는, 이미 Jore et al., 2011, Nature Structural & Molecular Biology 18: 529-537에서 보다 상세히 설명되고 확립되어 있다. 간단히 말해서, 타입 I-E의 성숙한 crRNA (mature crRNA)는, 종종 61 뉴클레오티드 길이이고, 및 8개 뉴클레오티드의 5' "핸들" 영역, 32개 뉴클레오티드의 "스페이서" 서열, 및 테트라뉴클레오티드 루프를 갖는 헤어핀을 형성하는 21개 뉴클레오티드의 3' 서열로 이루어진다 (도 5). 타입 I 시스템은 타입 Ⅱ (Cas9)와 다르며 및 다른 시스템의 상세는, Van der Oost 2014 Nat Rev Micr 12: 479-492에 기재되어 있다. 타입 Ⅱ (Cas9) 시스템에서, 제2 RNA (tracrRNA) 및 2개의 리보뉴클레아제를 활용하는, 다른 공정 메커니즘이 있다. 머리핀 외에, 타입 Ⅱ에서 성숙한 crRNA는 tracrRNA의 단편에 붙착되어 있다 (도 5). 그러나, 본 발명에서 사용되는 RNA는, 길이, 영역 또는 특이적 RNA 서열에 있어서도, 자연 발생형 crRNA의 디자인으로 절대적으로 디자인될 필요는 없다. 분명한 점은, 본 발명에 사용하기 위한 RNA 분자가, 공개된 데이터베이스에서 유전자 서열 정보에 기초하여 디자인될 수 있거나 또는 새로 발견될 수 있고, 그 다음, 예를 들어, 전체 또는 부분적으로 화학적 합성에 의해 인위적으로 만들어질 수 있다는 것이다. 본 발명의 RNA 분자는 또한 유전적으로 변형된 세포 또는 무세포 발현 시스템 (cell free expression)에서 발현하는 방식으로 디자인 및 생성될 수 있으며, 이 선택은, RNA 서열의 일부 또는 전부의 합성을 포함할 수 있다.
타입 Ⅱ (Cas9)에 crRNA의 구조 및 요건은 또한 Jinek et al., 2012 ibid에 기재되어 있다. 타입 I에서, 스페이서 서열의 5' 말단을 형성하고 및 8 뉴클레오티드의 5' 핸들에 의해 거기의 5' 측면에 위치된, 소위 "시드 (SEED)" 부분이 있다. Semenova et al. (2011, PNAS 108: 10098-10103)은, 비록 위치 6에서 잔기에 대해, 불일치가 허용될 수 있을지라도, 시드 서열의 모든 잔기가 표적 서열에 상보적이어야 하는 것을 확인하였다 (도 5). 타입 Ⅱ에서, 스페이서의 3' 말단에 위치된 10-12 뉴클레오티드의 시드가 있다 (도 5) (Van der Oost 2014 ids에 의해 검토됨). 유사하게, 표적 유전자좌 (target locus) (즉, 서열)를 향하는 본 발명의 리보핵산 단백질 복합체의 RNA 성분을 디자인하고, 만드는 경우, 타입 Ⅱ 시드 서열에 대한 필요한 일치 및 불일치 규칙은 적용될 수 있다.
따라서, 본 발명은, 핵산 샘플을 전술된 바와 같은 본 발명의 리보핵산 단백질 복합체와, 또는 전술된 바와 같은 본 발명의 Cas 단백질 또는 폴리펩티드 및 개별 표적화 RNA 성분과 접촉시키는 단계를 포함하는, 표적 핵산 분자에서 단일 염기 변화를 검출 및/또는 위치시키는 방법을 포함하고, 및 여기서 (리보핵산 단백질 복합체에서의 경우를 포함하는) 표적화 RNA의 서열은, 예를 들어, 8 뉴클레오티드 잔기의 연속 서열 (contiguous sequence)의 위치 6에서, 단일 염기 변화로 인해 정상적인 대립 유전자와 돌연변이 대립 유전자 사이에서 구별하도록 하는 것이다.
특정 이론에 구속되는 것을 원하지는 않지만, 본 발명의 리보핵산 단백질 복합체의 표적화 RNA 성분을 제조하는데 사용될 수 있는 디자인 규칙은, 이중 가닥 표적 폴리뉴클레오티드에서 소위 "PAM" (protospacer adjacent motif) 서열을 포함한다. E. coli의 타입 I-E 시스템에서, PAM 서열은 5'-CTT-3', 5'-CAT-3', 5'-CCT-3', 5'-CAC-3', 5'-TTT-3', 5'-ATT-3', 및 5'-AWG-3'과 같은, 뉴클레오티드 잔기의 보존된 트리플릿 (conserved triplet)일 수 있고, 여기서 W는 A, T 또는 U이다. 타입 I에서, 표적화된 가닥에 위치된 PAM 서열은, 보통 시드의 5'에 상응하는 위치에 있다. 타입 Ⅱ에서, 그러나, PAM은, 시드의 3'에 상응하는 위치에서, crRNA 스페이서의 3' 말단에 가깝게 변위된, 또는 비-표적, 가닥 상에, 다른 말단에 위치된다 (도 5) (Jinek et al. , 2012, op. cit.). 화농성 연쇄상 구균 (Streptococcus pyogenes) Cas9의 경우, PAM 서열은, 5'-NGG-3'인, 뉴클레오티드 잔기의 보존된 쌍을 갖는다. 최근에, 다른 Cas9 변이체 (타입 ⅡA 및 타입 ⅡC) (Ran et al., 2015 Nature 520: 186-191)-Fig 1A)는, 특징화되었고, PAM은 밝혀졌다 (Ran et al., 2015, ibid.-Fig 1C). 현재 입증된 Cas9 PAMs은: 타입 ⅡA 5'-NGGNNNN-3' (Streptococcus pyogenes), 5'-NNGTNNN-3' (Streptococcus pasteurianus), 5'-NNGGAAN-3' (Streptococcus thermophilus), 5'-NNGGGNN-3' (Staphylococcus aureus), 및 타입 ⅡC 5'-NGGNNNN-3' (Corynebacterium difteriae), 5'-NNGGGTN-3' (Campylobacter lari), 5'-NNNCATN-3' (Parvobaculum lavamentivorans), 5'-NNNNGTA-3' (Neiseria cinerea)을 포함한다. 지오바실러스 써모데니트리피칸스 (지오바실러스 써모데니트리피칸스) T12의 Cas9 (본 발명)는, 타입ⅡC에 속한다 (Ran et al., 2015, ibid.). 본 발명자들은, 놀랍게도, 본 발명에 사용하기 위한 PAM 서열의 선택이 본 발명의 Cas 단백질 및 폴리펩티드가 표적 서열과 상호작용하는 온도(들)에 영향을 줄 수 있다는 것을 발견했다. 특히, 본 발명자들은, 표적 서열의 3' 말단 이후에 5th 위치에 시토신, 및/또는 8th 위치에 아데닌으로, 넓은 온도 범위에 걸쳐 활성을 부여하는데 8-mer PAM 서열이 바람직하다는 것을 확인했다. 또한, 프로토스페이서 서열의 3' 말단 이후에 PAM 서열의 1st, 2nd, 3rd, 4th 및/또는 6th 위치에 시토신이 바람직하다.
특정 관점에서, 예를 들어, 20℃ 내지 100℃, 20℃ 내지 80℃, 30 내지 80℃, 20℃ 내지 70℃ 또는 25℃ 내지 65℃의 넓은 온도 범위 내에서 표적 서열과의 상호 작용은, 5'-NNNNCVAA-3' [SEQ ID NO: 48]의 PAM 서열을 활용하여 달성될 수 있다. 처음 4 PAM 위치에 대해서는 특별히 선호하지 않는다. 따라서, 처음 4개의 뉴클레오티드는 편리하게 임의의 뉴클레오티드 (NNNN)일 수 있다. 바람직하게는, 이러한 넓은 온도 범위 내에서 표적 서열과의 상호 작용은, 5'-NNNNCSAA-3' [SEQ ID NO: 49]의 PAM 서열을 활용하여 달성될 수 있다. 최적으로, PAM은 서열 5'-NNNNCGAA-3' [SEQ ID NO: 50] 또는 5'-NNNNCCAA-3' [SEQ ID NO: 51]일 수 있다.
표적 서열과 상호작용이 ≥30℃, 예를 들어, 30℃ 내지 100℃, 바람직하게는 30℃ 내지 70℃, 30℃ 내지 65℃, 또는 45℃ 내지 65℃의 온도 범위에서 요구되는 경우, PAM 서열은 최적으로 서열 5'-NNNNCNAA-3' [SEQ ID NO: 52] 또는 5'-NNNNCMCA-3' [SEQ ID NO:53]일 수 있다. 처음 4 PAM 위치에 대해서는 특별히 선호하지 않는다. 따라서, 처음 4개의 뉴클레오티드는 편리하게 임의의 뉴클레오티드 (NNNN)일 수 있다. 선택적으로, 예를 들어, PAM 서열은 5'-CCCCCNAA-3' 또는 5'-CCCCCMCA-3'일 수 있다. 선택적으로, 예를 들어, PAM 서열은, 5'-CCCCCAAA-3', 5'-CCCCCATA-3', 5'-CCCCCAGA-3', 5'-CCCCCACA-3', 5'-CCCCCTAA-3', 5'-CCCCCTTA-3', 5'-CCCCCTGA-3', 5'-CCCCCTCA-3', 5'-CCCCCGAA-3', 5'-CCCCCGTA-3', 5'-CCCCCGGA-3', 5'-CCCCCGCA-3', 5'-CCCCCCAA-3' [SEQ ID NO: 11], 5'-CCCCCCTA-3', 5'-CCCCCCGA-3', 또는 5'-CCCCCCCA-3'으로부터 선택될 수 있다.
본 발명의 구체 예에서, 표적화 RNA 분자는 35-200 잔기의 범위에서 길이를 가질 수 있다. 바람직한 구체 예에서, 원하는 핵산 서열에 표적화를 위해 사용되고, 상보적인 RNA의 부분은, 15 내지 32 잔기 길이이다. 자연-발생 crRNA의 맥락에서, 이것은, 예를 들어, Semenova et al. (2011 ibid.)의 도 1에 나타낸 바와 같은 스페이서 부분에 상응할 것이다.
본 발명의 리보핵산 단백질 복합체는, DNA 표적 서열에 실질적인 상보성을 갖는 RNA 서열에 CRISPR 반복 5'으로부터 유래된 8 잔기를 포함하는 표적화 성분을 가질 수 있다. DNA 표적 서열에 대해 상보성을 갖는 RNA 서열은, 스페이서 서열인 것으로서 crRNA의 맥락에서 상응하는 것으로 이해될 것이다. RNA의 5' 플랭킹 서열 (flanking sequence)은; 예를 들어, Semenova et al. (2011 ibid.)의 도 1에 나타낸 바와 같이, crRNA의 5' 핸들에 상응하는 것으로 고려될 것이다.
본 발명의 리보핵산 단백질 복합체는, DNA 표적 서열에 상보성을 갖는 표적화 RNA 서열의 3'에, 즉, 예를 들어, Semenova et al. (2011 ibid.)의 도 1에 나타낸 바와 같은, crRNA에서 스페이서 서열 측면에 위치하는 3' 핸들에 상응하는 것의 3'에 헤어핀 및 테트라뉴클레오티드 루프 형성 서열을 가질 수 있다.
특정 이론에 구속되는 것을 원하지는 않지만, 바람직한 리보핵산 단백질 복합체 및 이중 가닥 표적 폴리뉴클레오티드에서, 리보핵산 단백질 복합체의 표적화 RNA와 쌍을 이루지 않는 비-표적 핵산 가닥은, 5'-NNNNCNNA-3' [SEQ ID NO: 47], 5'-CNNNCNN-3', 5'-NNNCCNN-3', 5'-NNCNCNN-3', 5'-NNNNCCN-3', 및 5'-NCNNCNN-3' 중 하나 이상으로부터 선택된 직접 3'에 인접 PAM 서열을 포함할 수 있다. 선택적으로, 예를 들어, PAM 서열은, 5'-NNNNC-3', 5'-NNNNCNNA-3' [SEQ ID NO: 47], 5'-CNNNC-3', 5'-CNNNCNNA-3', 5'-NCNNC-3', 5'-NCNNCNNA-3', 5'-NNCNC-3', 5'-NNCNCNNA-3', 5'-NNNCC-3', 5'-NNNCCNNA-3', 5'-NNNNCC-3', 5'-NNNNCCNA-3', 5'-CCNNC-3', 5'-CCNNCNNA-3', 5'-CNCNC-3', 5'-CNCNCNNA-3', 5'-CNNCCN-3', 5'-CNNCCNNA-3', 5'-CNNNCC-3', 5'-CNNNCCNA-3', 5'-CCCNCN-3', 5'-CCCNCNNA-3', 5'-CCNCCN-3', 5'-CCNCCNNA-3', 5'-CCNNCC-3', 5'-CCNNCCNA-3', 5'-CCCCC-3' [SEQ ID NO: 12], 5'-CCCCCNNA-3' [SEQ ID NO: 13], 5'-CCCCCC-3' [SEQ ID NO: 14], 5'-CCCCCCNA-3' [SEQ ID NO: 10], 5'-NCCNC-3', 5'-NCCNCNNA-3', 5'-NCCCC-3', 5'-NCCCCNNA-3', 5'-NCCCCC-3' [SEQ ID NO: 15], 5'-NCCCCCNA-3' [SEQ ID NO: 16], 5'-NNCCC-3', 5'-NNCCCNNA-3', 5'-NNCCCC-3', 5'-NNCCCCNA-3', 5'-NNNCCC-3', 및 5'-NNNCCCNA-3'으로부터 선택될 수 있다. PAM 서열은, 5'-CNCCCCAC-3' [SEQ ID NO: 17], 5'-CCCCCCAG-3' [SEQ ID NO: 18], 5'-CCCCCCAA-3' [SEQ ID NO: 11], 5'-CCCCCCAT-3' [SEQ ID NO: 19], 5'-CCCCCCAC-3' [SEQ ID NO: 20], 5'-ATCCCCAA-3' [SEQ ID NO: 21], 또는 5'-ACGGCCAA-3' [SEQ ID NO: 22]일 수 있다. 바람직하게는, PAM 서열은 서열 5'-NNNNCNNA-3' [SEQ ID NO: 47]일 것이다. 그러나, 뉴클레오티드의 다른 조합이 Cas 단백질 또는 폴리펩티드의 농도 및/또는 원하는 적용에 의존하여 사용될 수 있는 것으로 인정될 것이다. 특히, 처음 4 PAM 위치에 대한 특별한 선호도는 없다. 따라서, 처음 4개의 뉴클레오티드는, 편리하게 임의의 뉴클레오티드 (NNNN)일 수 있다. 이들 서열은, 자연적으로 발생하는 crRNA의 맥락에서 "프로토스페이서 인근 모티프" 또는 "PAM"으로 불리는 것에 상응한다. 타입 ⅡC CRISPR/Cas 시스템에서, 이들 PAM 서열은, 표적 서열에 대한 - 자연 시스템 (natural system)에서 표적, 및 따라서 바람직하게는, 또한 본 발명에 따른 RNAs의 표적 모두에서 - crRNA의 고도의 특이성을 보장하기 위해, 캐스케이드/crRNA 복합체와 이의 dsDNA 표적과의 안정한 상호작용을 가능하게 한다. 바람직하게는, 프로토스페이서에 바로 인접한 서열은, 5'-NNNCATN-3'이 아닐 것이다.
부가적으로, PAM 서열은, 서열 5'-NNNNCNNA-3' [SEQ ID NO: 47], 예를 들어 5'-NNNNCNAA-3' [SEQ ID NO: 52], 또는 5'-NNNNCMCA-3' [SEQ ID NO: 53]일 수 있다.
중온성 SpCas9의 한계 중 하나는, 25 내지 44℃에서 활성을 오직 나타낸다는 것이고; 이들 온도를 벗어나면, SpCas9 활성은 감지할 수 없는 수준으로 급격히 감소한다 (Mougiakos et al., 2017, ACS Synth Biol. 6:849-861). 이의 중온성 상동유전자 SpCas9의 25-44℃ 범위와 대조적으로, 본 발명의 ThermoCas9는, 시험관 내에서 20-70℃의 훨씬 넓은 온도 범위에서 활성이다. ThermoCas9의 확장된 활성 및 안정성은, 20-70℃의 온도에서 DNA 조작을 필요로 하는 분자 생물학 기술에서 이의 적용뿐만 아니라, 강력한 효소 활성을 필요로 하는 가혹한 환경에서 이의 활용도 가능하게 한다. 따라서, ThermoCas9는 또한 호열성 및 중온성 유기체 모두에 대한 게놈 편집 도구로 사용될 수 있다.
넓은 기능성 온도 활성 범위를 갖는 것, 즉, 저온 및 고온 모두에서, 예를 들어, 20℃ 및 70℃, 또는 20℃ 및 65℃ 또는 25℃ 및 65℃ 모두에서, 기능성인 것에 부가하여, ThermoCas9 또는 (예를 들어, sgRNA 또는 tracRNA와 같은) 관련 인자의 구조적 특색 (features)을 변형시켜, ThermoCas9이 표적화된 절단 또는 결합할 수 있거나 또는 표적화된 절단 또는 결합이 효율적으로 일어나는, 온도 범위를 조작하기 위한 능력은, 핵산 서열 조작을 넘어 발휘되는 더 큰 수준의 제어를 가능하게 할 것이다. 그러나, 지금까지, 특정 온도에서 Cas9 활성의 분자 결정요인 (molecular determinants)에 대해서 알려진 것은 거의 없다.
본 발명자들은 ThermoCas9의 열안정성을 부여하는데 중요한 몇 가지 요인을 확인하였으며, 그 하나는 ThermoCas9의 PAM 선호도 (PAM preferences)이다. ThermoCas9의 PAM 선호도는, 온도 범위의 낮은 부분 (≤30℃)에서의 활성에 대해 매우 엄격한 반면, PAM의 더 많은 다양성은 보통 내지 최적 온도 (37℃ 내지 60℃)에서 활성을 가능하게 한다. 이로써, PAM 서열은, 정해진 온도에서 표적의 가장 효율적인 결합, 절단, 표지 또는 변형을 얻기 위해 변경될 수 있다. 이는, 특정 적용에 의존하여, ThermoCas9의 적용에 상당한 유연성을 제공한다. 예를 들어, 몇몇 적용에서, 매우 넓은 온도 범위, 예를 들어, 20℃ 내지 70℃, 바람직하게는, 20℃ 내지 65℃ 또는 25℃ 내지 65℃에서, 표적 결합, 절단, 표지 또는 변형은 바람직할 수 있다. 이러한 넓은 온도 범위 내에서 표적 서열의 결합, 절단, 표지 또는 변형은, 5'-NNNNCVAA-3' [SEQ ID NO: 48]의 PAM 서열을 활용하여 달성될 수 있다. 바람직하게는, 이러한 넓은 온도 범위 내에서 표적 서열의 결합, 절단, 표지 또는 변형은, 5'-NNNNCSAA-3' [SEQ ID NO: 49], 예를 들어, 5'-NNNNCGAA-3' [SEQ ID NO:50] 또는 5'-NNNNCCAA-3' [SEQ ID NO: 51]의 PAM 서열을 활용하여 달성될 수 있다. 처음 4 PAM 위치에 대해서 특이적 선호도는 없다. 따라서, 처음 4개의 뉴클레오티드는, 편리하게 임의의 뉴클레오티드 (NNNN)일 수 있다. 선택적으로, 예를 들어, 5'-CCCCCGAA-3' 또는 5'-CCCCCCAA-3' [SEQ ID NO:11]일 수 있다.
표적의 결합, 절단, 표지 또는 변형이 ≥30℃, 예를 들어, 30℃ 내지 100℃, 바람직하게는 30℃ 내지 70℃, 30℃ 내지 65℃, 또는 45℃ 내지 65℃의 범위에서 요구되는 경우, PAM 서열은 최적으로 서열 5'-NNNNCNAA-3' [SEQ ID NO: 52] 또는 5'-NNNCMCA-3' [SEQ ID NO: 53]일 수 있다. 처음 4 PAM 위치에 대해서는 특별히 선호하지 않는다. 따라서, 처음 4개의 뉴클레오티드는 편리하게 임의의 뉴클레오티드 (NNNN)일 수 있다. 선택적으로, 예를 들어, PAM 서열은 5'-CCCCCNAA-3' 또는 5'-CCCCCMCA-3'일 수있다. 선택적으로, 예를 들어, PAM 서열은 5'-CCCCCAAA-3', 5'-CCCCCATA-3', 5'-CCCCCAGA-3', 5'-CCCCCACA-3', 5'-CCCCCTAA-3', 5'-CCCCCTTA-3', 5'-CCCCCTGA-3', 5'-CCCCCTCA-3', 5'-CCCCCGAA-3', 5'-CCCCCGTA-3', 5'-CCCCCGGA-3', 5'-CCCCCGCA-3', 5'-CCCCCCAA-3' [SEQ ID NO: 11], 5'-CCCCCCTA-3', 5'-CCCCCCGA-3', 또는 5'-CCCCCCCA-3'으로부터 선택될 수 있다.
여기에 제공된 본 발명의 PAM 서열은, 여기서 개시된 서열, 예를 들어, 6-mer, 7-mer 또는 8-mer 서열을 포함한다. 상기 6-mer, 7-mer 또는 8-mer 서열은, 표적화 RNA에 의해 결합된 것에 상보적인, 프로토스페이서 서열과, PAM 서열의 5' 말단 사이에 공간을 차지하는 부가적인 핵산이 없이, 비-표적 가닥 상에 프로토스페이서 서열의 3'을 바로 시잘할 수 있다. 그러나, 상기 6-mer, 7-mer 또는 8-mer 서열의 3' 말단에서 PAM 서열의 일부를 형성하는 부가적인 핵산일 수 있는 것으로 인정될 것이다. 부가적으로 또는 선택적으로, 비-표적 가닥은, PAM 서열의 3'에 부가적인 핵산을 포함할 수 있다.
본 발명의 핵산단백질 복합체는, 본 발명의 리보핵산 단백질 복합체 및 상기 리보핵산 단백질이 결합되는, 핵산의 표적 핵산 가닥을 포함할 수 있다.
결합, 절단, 표지 및 변형 온도
본 발명의 Cas 단백질의 활성, 예를 들어, 뉴클레아제활성의 최적 온도 범위를 포함하는, 온도 범위는, 공지된 Cas9 단백질의 온도 범위보다 상당히 높다. 또한, 활성을 유지하는 상한 범위는 공지된 Cas9 단백질의 것보다 훨씬 높다. 더 높은 최적의 온도 및 기능적 범위는, 고온에서의 유전 공학에 상당한 장점을 제공하며, 따라서, 예를 들어, 호열성 유기체의 게놈의 편집에 있어서, 이들 중 많은 것들은 상승된 온도에서 수행되는 다양한 산업적, 농업적 및 약학적 공정에 유용하다. 따라서, 본 발명의 방법, 사용, 핵산단백질 및 형질전환된 세포는, 산업 공정, 예를 들어, 대사 공학 목적 (metabolic engineering purposes)을 위한 게놈 편집을 제공하는데 유용할 수 있다. 비-표적 가닥의 프로토스페이서 서열에 바로 인접한, 본 발명의 PAM 서열의 존재는, 표적 서열에 대한 Cas 단백질 및 폴리펩티드의 특이성을 개선하고, 및 더 높은 온도에서 및 더 넓은 기능적 온도 범위에서 걸쳐 Cas 단백질 및 폴리펩티드의 사용을 지지한다.
현저히 더 큰 열안정성에 따라, 본 발명의 Cas 단백질은, 공지된 Cas9 단백질의 것보다 훨씬 더 넓은 온도 범위에 걸쳐서, 기능, 예를 들어, 뉴클레아제활성을 보유한다. 또한, 이것이 활성을 보유하는 범위의 상한은, 공지된 Cas9 단백질의 것보다 훨씬 높다. 더 높은 최적의 온도 및 기능적 범위는, 고온에서의 유전 공학에서, 예를 들어, 상승된 온도에서 수행되는 다양한 산업, 농업 및 제약 공정에서 유용성을 갖는 호열성 및 중온성 유기체의 게놈 편집에서 상당한 장점을 제공한다. ThermoCas9의 확장된 활성 및 안정성은, 넓은 온도 범위, 예를 들어, 20-70℃에서의 DNA 조작을 필요로 하는 분자 생물학 기술에서 적용뿐만 아니라, 강력한 효소 활성을 필요로 하는 가혹한 환경에서 이의 활용을 가능하게 한다. 따라서, ThermoCas9는 또한 호열성 및 중온성 유기체 모두를 위한 게놈 편집 도구로써 사용될 수 있다.
유리하게는, 본 발명자들은 또한 본 발명의 Cas 단백질이 표적 서열의 전사적 제어, 예를 들어, 표적 서열에 대한 서열-특이적 결합에 의한 침묵 전사 (silencing transcription)을 지시하는데 사용될 수 있다는 것을 알아냈다. 따라서, ThermoCas9는 또한 호열성 및 중온성 유기체에서, 예를 들어, 표적 유전자의 전사를 침묵 또는 활성화하는데 전사 조절 도구로써 사용될 수 있다. 따라서 ThermoCas9는 또한 호열성 및 중온성 유기체 모두에서 유전자-침묵 도구로써 사용될 수 있다.
유리하게는, 본 발명의 Cas 단백질 또는 폴리펩티드는, 20℃ 내지 100℃의 온도에서 핵산 결합, 절단, 표지 또는 변형할 수 있지만, 상승된 온도에서, 예를 들어, 41℃ 내지 122℃, 바람직하게는, 50℃ 내지 100℃의 온도에서 특히 유용하다. 본 발명의 Cas 단백질 및 폴리펩티드는, DNA, RNA 및 합성 핵산을 결합, 절단, 표지 또는 변형시킬 수 있다. 본 발명의 Cas 단백질 또는 폴리펩티드는 또한, 예를 들어, 20 내지 50℃ 범위의 온도에서 뉴클레아제활성, 유전자 편집 및 핵산 표지 적용에 대한 조작성 (operability)을 제공할 수 있다.
온도 범위가 여기에 포함되는 경우, 말단점이 개시된 온도 범위에 포함, 즉 범위가 "포괄하는" 것으로 의도된다. 예를 들어, 20℃ 내지 100℃ 범위의 온도에서 활성이 있는 것으로 명시된 경우, 20℃ 및 100℃의 온도는 상기 범위에 포함된다.
바람직하게는, 본 발명의 Cas 단백질 또는 폴리펩티드는, 결합, 절단, 표지 또는 변형될 폴리뉴클레오티드 분자(들)에서 표적 서열을 인식하는 적절한 gRNA (가이드 RNA, 또한 표적화 RNA 분자라 함)와 결합되는 경우, 20℃ 내지 100℃, 선택적으로 20℃ 내지 70℃, 20℃ 내지 65℃, 25℃ 내지 70℃, 25℃ 내지 65℃, 55℃ 내지 100℃, 50℃ 내지 70℃, 50℃ 내지 70℃, 55℃ 내지 70℃, 또는 55℃ 내지 65℃ 범위의 온도에서 결합, 절단, 표지 또는 변형시킨다.
바람직하게는, 본 발명의 Cas 단백질 또는 폴리펩티드는, 결합, 절단, 표지 또는 변형될 폴리뉴클레오티드 분자(들)에서 표적 서열을 인식하는 적절한 gRNA (가이드 RNA, 또한 표적화 RNA 분자라 함)와 결합되는 경우, 50℃ 내지 100℃, 선택적으로 55℃ 내지 100℃, 60℃ 내지 100℃, 65℃ 내지 100℃, 70℃ 내지 100℃, 75℃ 내지 100℃, 80℃ 내지 100℃, 85℃ 내지 100℃, 90℃ 내지 100℃, 95℃ 내지 100℃ 범위의 온도에서 결합, 절단, 표지 또는 변형시킨다. 좀 더 바람직하게는, 본 발명의 Cas 단백질은, 51℃ 내지 99℃, 52℃ 내지 98℃, 53℃ 내지 97℃, 54℃ 내지 96℃, 55℃ 내지 95℃, 56℃ 내지 94℃, 57℃ 내지 93℃, 58℃ 내지 92℃, 59℃ 내지 91℃, 60℃ 내지 90℃, 61℃ 내지 89℃, 62℃ 내지 88℃, 63℃ 내지 87℃, 64℃ 내지 86℃, 65℃ 내지 85℃, 66℃ 내지 84℃, 67℃ 내지 83℃, 68℃ 내지 82℃, 69℃ 내지 81℃, 70℃ 내지 80℃, 71℃ 내지 79℃, 72℃ 내지 78℃, 73℃ 내지 77℃, 74℃ 내지 76℃ 범위의 온도, 또는 75℃의 온도에서 핵산을 결합, 절단, 표지 또는 변형시킨다. 바람직하게는, 본 발명의 Cas 단백질은, 60℃ 내지 80℃, 61℃ 내지 79℃, 62℃ 내지 78℃, 63℃ 내지 77℃, 64℃ 내지 76℃, 60℃ 내지 75℃, 60℃ 내지 70℃의 온도 범위에서 핵산을 결합, 절단, 표지 또는 변형한다. 최적으로, 본 발명의 Cas 단백질은, 60℃ 내지 65℃의 범위, 바람직하게는, 65℃의 온도에서 핵산을 결합, 절단, 표지 또는 변형시킨다.
표적화 RNA 분자는, 본 발명의 Cas 단백질 및 폴리펩티드와 함께 사용하도록 디자인될 수 있고, 여기서, 상기 표적화 RNA 분자는 표적 가닥에서 표적 서열에 결합되며, 비-표적 가닥은 프로토스페이서 서열의 3' 바로 옆에 여기에 제공된 PAM 서열을 더욱 포함한다. 상기 PAM 서열은, 5'-NNNNNNNA-3', 바람직하게는, 5'-NNNNCNNA-3' [SEQ ID NO: 47], 선택적으로, 예를 들어, 5'-CCCCCCNA-3' [SEQ ID NO: 10] 또는 5'-CCCCCCAA-3' [SEQ ID NO: 11]을 포함할 수 있고, 및 본 발명의 사용, 방법, 형질전환된 세포, 및 핵산단백질은, 55℃ 내지 65℃의 온도 범위에 걸쳐, 바람직하게는, 50℃ 내지 70℃, 40℃ 내지 65℃, 45℃ 내지 75℃, 37℃ 내지 78℃ 및/또는 20℃ 내지 80℃의 온도 범위에 걸쳐, 표적 가닥의 결합, 절단, 표지 및/또는 변형을 제공할 수 있다.
PAM 서열은, 주어진 온도에서 표적의 가장 효율적인 절단을 얻기 위해 변경될 수 있다. 이는, 특정 적용에 의존하여, 본 발명의 Cas 단백질의 적용에 큰 폭의 유연성을 제공한다. 20℃ 내지 100℃, 바람직하게는, 20℃ 내지 70℃, 또는 20℃ 내지 65℃, 또는 25℃ 내지 65℃의 온도 범위 내에서 결합, 절단, 표지 또는 변형 활성, 예를 들어 절단 활성이 요구되는 경우, 그 다음 활성은, 5'-NNNNCVAA-3' [SEQ ID NO: 48]의 PAM서열을 활용하여 달성될 수 있고, 바람직하게는, 이러한 온도 범위 내에서 활성은, 5'-NNNNCSAA-3' [SEQ ID NO: 49], 예를 들어, 5'-NNNNCGAA-3' [SEQ ID NO: 50] 또는 5'-NNNNCCAA-3' [SEQ ID NO: 51]의 PAM 서열을 활용하여 달성될 수 있다. 선택적으로, 활성은, 예를 들어, 5'-CCCCCGAA-3' [SEQ ID NO: 52] 또는 5'-CCCCCCAA-3' [SEQ ID NO: 11]의 PAM 서열을 활용하여 달성될 수 있다.
본 발명자들은 ThermoCas9의 열안정성이 가이드 (sgRNA)의 결합과 함께 증가하여 리보핵단백질 복합체를 형성한다는 것을 확인했다. 가이드 (sgRNA)는, tracrRNA 및 crRNA를 적절하게 포함할 수 있다. 이러한 배열에서, 가이드는, 뉴클레오티드 스페이서-단편 및 반복-단편을 포함하는 crRNA를 적절하게 포함할 수 있다. crRNA는, 17-20nt의 길이가 적절할 수 있다. 선택적으로, crRNA는 길이가 17nt일 수 있다. 선택적으로, crRNA는 길이가 18nt, 길이가 19nt 또는 길이가 20nt일 수 있다. 가이드는 또한 tracrRNA (안티-반복 단편 (crRNA의 반복 단편과 염기쌍))을 포함할 수 있다. tracrRNA 및 crRNA는 합성 링커 (synthetic linker)에 의해 분리될 수 있다. 다음의 가이드는 바람직한 배열을 나타낸다: 5'-[crRNA (17-20 뉴클레오티드 스페이서-단편 및 반복-단편) - (선택적: 2개의 RNAs를 연결하는 합성 루프) - tracrRNA (안티-반복 단편 (crRNA의 반복 단편과 염기쌍) 및 일부 가변 스템-루프 구조 (아래 참조), 이는 몇몇 시스템에서는 어느 정도 절단될 수 있음)]-3'.
일반적으로, tracrRNA는, 예를 들어, crRNA 및 tracrRNA 포함하는, 키메라 단일-가이드 RNA (sgRNA)의 일부로서 제공될 것이다. tracrRNA는 하나 이상의 헤어핀 구조, 바람직하게는 둘 이상의 헤어핀 구조 또는 좀 더 바람직하게는 셋 이상의 헤어핀 구조가 수반되는 안티-반복 영역으로 이루어질 수 있다. 스페이서 원위 단부 (spacer distal end)에서 (4-뉴클레오티드 링커, 예를 들어, 5'-GAAA-3'에 의해 융합된 합성 sgRNA 키메라에서 상보적인 tracrRNA 부분 (안티-반복)의 5'말단 및 crRNA 부분 (반복)의 3'말단에 의해 형성된) 전체-길이의 반복/안티-반복 헤어핀의 존재는, 뉴클레아제에 앵커 (anchor)로써 기능하지만, 표적 선택 및 절단 활성에 필수적인 것은 아니다. 예를 들어, tracrRNA 부분의 최대 50-nt 길이의 결손의 스페이서 원위 단부에서 결손은, DNA 절단 효율에 거의 또는 전혀 영향을 없이 허용될 수 있다. 따라서, 예를 들어, 전체-길이 반복-안티-반복 헤어핀의 스페이서 원위 단부의 결손은, 표적 DNA 절단 효율의 면에서 타협 없이, 최대 50nt, 최대 45nt, 최대 40nt, 최대 35nt, 최대 30nt, 최대 25nt, 최대 20nt, 최대 15nt, 최대 10nt, 또는 최대 5nt로 이루어질 수 있다.
놀랍게도, 본 발명자들은 또한 tracrRNA의 구조가 ThermoCas9의 열안정성 및 활성, 특히 절단 활성의 효율에 영향을 미친다는 것을 확인했다. 구체적으로, tracrRNA 또는 sgRNA에서 헤어핀 (또는 스템-루프) 구조의 수는, 주어진 온도에서 표적의 가장 효율적인 결합, 절단, 표지 또는 변형을 얻기 위해 변경될 수 있다. 이는, 특정 적용에 의존하여, 본 발명의 Cas 단백질의 적용에 큰 폭의 유연성을 제공한다. 선택적으로, tracrRNA 또는 sgRNA는, 하나 이상의 스템-루프 구조, 둘 이상의 스템-루프 구조 또는 셋 이상의 스템-루프 구조를 형성할 수 있는 핵산 서열과 함께 제공될 수 있다. 선택적으로, tracrRNA 또는 sgRNA는, 하나 이상의 스템-루프 구조, 둘 이상의 스템-루프 구조 또는 셋 이상의 스템-루프 구조를 형성하도록 배열된 핵산 서열과 함께 제공될 수 있다. 바람직하게는, sgRNA는, 적어도 3개의 스템-루프 구조를 형성할 수 있는 핵산 서열과 함께 제공될 것 이다.
선택적으로, 20℃ 내지 60℃, 바람직하게는 37℃ 내지 60℃의 온도 범위, 또는 37℃, 40℃, 45℃, 50℃, 55℃ 또는 60℃에서 결합, 절단, 표지 또는 변형 활성, 예를 들어, 절단 활성이 요구되는 경우, 그 다음 활성은, 하나 이상의 스템-루프 구조를 형성할 수 있는 sgRNA 서열을 활용하여 달성될 수 있다.
선택적으로, 20℃ 내지 65℃, 바람직하게는 37℃ 내지 65℃, 좀 더 바람직하게는 45℃ 내지 55℃의 온도 범위 또는 37℃, 40℃, 45℃, 50℃, 55℃ 또는 60℃에서 결합, 절단, 표지 또는 변형 활성, 예를 들어, 절단 활성이 요구되는 경우, 그 다음 활성은, 2 이상의 스템-루프 구조를 형성할 수 있는 sgRNA 서열을 활용하여 달성될 수 있다.
선택적으로, 20℃ 내지 100℃, 바람직하게는 20℃ 내지 70℃, 좀 더 바람직하게는 37℃ 내지 65℃의 온도 범위 또는 37℃, 40℃, 45℃, 50℃, 55℃, 60℃ 또는 65℃에서 결합, 절단, 표지 또는 변형, 예를 들어, 절단 활성이 요구되는 경우, 그 다음 활성은, 3 이상의 스템-루프 구조를 형성할 수 있는 sgRNA 서열을 활용하여 달성될 수 있다.
바람직하게는, tracrRNA에 상응하는 sgRNA의 부분은, 5' 헤어핀을 예시하는 서열; AAGGGCUUUCUGCCUAUAGGCAGACUGCCC [SEQ ID NO: 54]을 포함할 것이다. 바람직하게는, tracrRNA에 상응하는 sgRNA 부분은, '중간' 헤어핀을 예시하는, 서열; GUGGCGUUGGGGAUCGCCUAUCGCC [SEQ ID NO: 55]을 더욱 포함할 것이다. 바람직하게는, tracrRNA에 상응하는 sgRNA 부분은, 3' 헤어핀을 예시하는, 서열; CGCUUUCUUCGGGCAUUCCCCACUCUUAGGCGUUUU [SEQ ID NO: 56]을 더욱 포함할 것이다.
바람직하게는, tracrRNA에 상응하는 sgRNA 부분은, 5' 헤어핀 및 중간 헤어핀을 포함하는, 서열; AAGGGCUUUCUGCCUAUAGGCAGACUGCCCGUGGCGUUGGGGAUCGCCUAUCGCC [SEQ ID NO: 57]을 포함할 것이다.
바람직하게는, tracrRNA에 상응하는 sgRNA 부분은, 5' 헤어핀, 중간 헤어핀 및 3' 헤어핀을 포함하는, 서열; AAGGGCUUUCUGCCUAUAGGCAGACUGCCCGUGGCGUUGGGGAGAUCG CCUAUCGCCCGCUUUCUUCGGGCAUUCCCCACUCUUAGGCGUUUU [SEQ ID NO: 58]을 포함할 수 있다.
본 발명자들은, tracrRNA 스캐폴드의 예측된 스템-루프의 수가, 특히 상승된 온도에서, DNA 절단에 결정적인 역할을 한다는 것을 발견했다. 그들은, tracrRNA 스캐폴드의 3개의 스템-루프의 존재가 절단 활성에 필수적이지는 않을지라도, 3개의 모든 루프가 존재할 때, 전체 길이의 tracrRNA가 상승된 온도에서 최적의 ThermoCas9-계 DNA 절단을 위해 요구되는 것을 나타내는 범위의 모든 온도에서 절단이 가장 효율적이라는 것을 밝혀냈다. 대조적으로, 3' 헤어핀의 제거는, 절단 효율의 감소를 결과한다. 게다가, 본 발명자들은, 중간 및 3' 헤어핀 모두의 제거가 ThermoCas9의 절단 효율에서, 특히 기능적 온도 범위의 상한 및 하한에서, 심각한 저하를 결과한다는 것을 확인했다. 바람직하게는, 표적 서열의 결합, 절단, 표지 또는 변형은, 상승된 온도, 예를 들어, 45℃ 내지 100℃, 50℃ 내지 100℃, 50℃ 내지 70℃, 50℃ 내지 65℃, 55℃ 내지 65℃ 또는 20℃ 내지 100℃, 20℃ 내지 70℃, 20℃ 내지 65℃와 같은 넓은 온도 범위 내에서 요구된다. 바람직하게는, 3개의 스템-루프 구조를 갖는 sgRNA와 결합된 ThermoCas9는, 20℃ 내지 100℃, 20℃ 내지 70℃, 20℃ 내지 65℃, 45℃ 내지 100℃, 50℃ 내지 100℃, 50℃ 내지 70℃, 50℃ 내지 65℃ 또는 55℃ 내지 65℃ 범위에서 선택된 온도에서 적어도 1분, 적어도 2분, 적어도 3분, 적어도 4분, 또는 적어도 5분, 바람직하게는 5분 동안 표적 서열의 결합, 절단, 표지 또는 변형이 가능할 것이고, 안정하게 유지될 것이다.
부가적으로, 본 발명자들은 ThermoCas9 활성, 예를 들어, 결합, 절단, 표지 또는 변형 활성의 효율을 조종하기 위해 sgRNA의 스페이서 서열의 길이가 변할 수 있음을 발견하였다. 통상적으로, 스페이서 서열은, 길이가 18nt 내지 25nt의 범위일 것이다. 선택적으로, 스페이서 서열은 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt 또는 25nt의 길이일 것이다. 바람직하게는, 19nt, 20nt, 21nt 또는 23nt의 스페이서 길이는 사용될 것인데, 이는 본 발명의 Cas9 단백질이 이들 스페이서 길이를 갖는 sgRNA와 결합하는 경우 가장 높은 효율로 표적 서열을 절단하기 때문이다. 18nt의 스페이서가 사용되는 경우, 절단 효율은 현저히 떨어진다. 바람직하게는, 스페이서의 길이는 23nt일 것이다.
본 발명의 모든 관점에서, Cas 단백질 또는 폴리펩티드는 박테리아, 고세균류 또는 바이러스로부터 얻거나 유래될 수 있거나; 또는 선택적으로 새로 합성될 수 있다. 바람직한 구체 예에서, 본 발명의 Cas 단백질 또는 폴리펩티드는, 고세균 또는 박테리아로 분류될 수 있지만, 바람직하게는, 박테리아인, 호열성 원핵 유기체로부터 유래된다. 좀 더 바람직하게는, 본 발명의 Cas 단백질 또는 폴리펩티드는 호열성 박테리아로부터 유래될 것이다. 여기서, 용어 "호열성"은 비교적 높은 온도에서 생존 및 성장할 수 있는, 예를 들어, 본 발명의 맥락에서, 41 내지 122℃ (106 내지 252 ℉)의 온도에서 핵산을 절단, 결합 또는 변형시킬 수 있는 것을 의미하는 것으로 이해되어야 한다. 바람직하게는, 본 발명의 Cas 단백질 또는 폴리펩티드는, 하나 이상의 호열성 박테리아로부터 단리될 수 있고, 60℃ 초과에서 기능할 것이다. 바람직하게는, 본 발명의 Cas 단백질 또는 폴리펩티드는, 하나 이상의 호열성 박테리아로부터 단리될 수 있고, 60℃ 내지 80℃ 범위 및 최적으로 60℃ 내지 65℃ 범위에서 기능할 것이다. 바람직한 구체 예에서, 본 발명의 Cas 단백질 또는 폴리펩티드는 지오바실러스 속 (Geobacillus sp.)으로부터 유래된다. 좀 더 바람직하게는, 본 발명의 Cas 단백질은 지오바실러스 써모데니트리피칸스로부터 유래된다. 더욱 더 바람직하게는, 본 발명의 Cas 단백질은 지오바실러스 써모데니트리피칸스 T12로부터 유래된다. 본 발명의 Cas 단백질 또는 폴리펩티드는 바이러스로부터 유래될 수 있다.
기능성 모이어티 (Functional Moieties)
유리하게는, 서열-특이적 방식으로 임의의 폴리뉴클레오티드 서열을 표적화하는 본 발명의 Cas 단백질, 폴리펩티드 및 리보핵산 단백질 복합체의 능력은, 어떻게든 표적 핵산을 변형시키기 위해, 예를 들어, 이를 절단 및/또는 이를 표지 및/또는 이를 변형시키는데 활용될 수 있다. 따라서, 부가적인 단백질이 Cas 단백질 또는 폴리펩티드와 함께 제공될 수 있어 이를 달성하는 것으로 인정될 것이다. 따라서, 본 발명의 Cas 단백질 또는 폴리펩티드는, 적어도 하나의 기능성 모이어티를 더욱 포함할 수 있고, 및/또는 본 발명의 Cas 단백질, 폴리펩티드 또는 리보핵산 단백질 복합체는, 적어도 하나의 추가 단백질을 포함하는 단백질 복합체의 일부로서 제공될 수 있다. 바람직한 관점에서, 본 발명은 Cas 단백질, 폴리펩티드 또는 리보핵산 단백질 복합체를 제공하며, 여기서, 상기 Cas 단백질 또는 적어도 하나의 추가의 단백질은, 적어도 하나의 기능성 모이어티를 더욱 포함한다. 상기 적어도 하나의 기능성 모이어티는 Cas 단백질에 융합 또는 연결될 수 있다. 바람직하게는, 상기 적어도 하나의 기능성 모이어티는, 천연 또는 인공 단백질 발현 시스템에서 발현을 통해 Cas 단백질에 번역적으로 융합될 수 있다. 선택적으로, 상기 적어도 하나의 기능성 모이어티는, 화학적 합성 단계에 의해 Cas 단백질에 공유결합으로 연결될 수 있다. 바람직하게는, 상기 적어도 하나의 기능성 모이어티는, Cas 단백질의 N-말단 및/또는 C-말단; 바람직하게는, C-말단에 융합 또는 연결된다.
바람직하게는, 상기 적어도 하나의 기능성 모이어티는 단백질일 것이다. 이는 이종 단백질일 수 있거나, 또는 선택적으로 Cas 단백질이 유래된 박테리아 종에 기원할 수 있다. 적어도 하나의 기능성 모이어티는; 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라아제, 포스페타아제, 키아나제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치 측정 서열, 항체 에피토프 또는 친화성 정제태그 (affinity purification tag)로부터 선택적으로 선택된 단백질일 수 있다.
특히 바람직한 관점에서, 본 발명은 Cas 단백질, 폴리펩티드, 또는 리보핵산 단백질 복합체를 제공하고, 여기서 적어도 하나의 기능성 모이어티는, 마커 단백질, 예를 들어, GFP이다.
뉴클레아제활성 (Nuclease Activity)
본 발명의 Cas 리보핵산 단백질은, 온도, 바람직하게는, 여기에 개시된 상승된 온도, 예를 들어, 50℃ 내지 100℃의 온도에서, 핵산 결합, 절단, 표지 또는 변형 활성을 갖는다. 본 발명의 리보핵산 단백질은, DNA, RNA 또는 합성 핵산을 결합, 절단, 표지 또는 변형할 수 있다. 바람직한 관점에서, 본 발명의 Cas 리보핵산 단백질은, 서열-특이적 방식으로 DNA, 특히 이중-가닥 DNA를 절단할 수 있다.
본 발명의 Cas 단백질, 폴리펩티드 또는 리보핵산 단백질은, 하나 이상의 뉴클레아제도메인을 가질 수 있다. 부위-특이적 뉴클레아제는, DNA의 가닥을 따라 선택된 위치에서 이중 가닥 절단 (DSBs)의 발생을 가능하게 할 수 있다. 표적 숙주 세포에서, 이것은 게놈 내에 특이적 미리-선택된 위치에서 DSBs가 만들어지는 것을 가능하게 한다. 부위-특이적 뉴클레아제에 의한 이러한 절단의 생성은, 관심의 게놈 내에 원하는 위치에서 DNA를 삽입, 결손 또는 변형시키기 위해 내인성 세포내 복구 기작 (endogenous cellular repair machinery)이 용도 변경되는 것을 촉발한다.
단백질 또는 폴리펩티드 분자의 하나 이상의 뉴클레아제활성 부위는, 예를 들어, 단백질 또는 폴리펩티드에 연결된 또는 융합된 또 다른 기능성 모이어티, 예를 들어, FokI 뉴클레아제와 같은 뉴클레아제도메인의 활성을 가능하게 하기 위해, 비활성화될 수 있다.
따라서, 본 발명의 Cas 단백질, 폴리펩티드 및 리보핵산 단백질이 내인성 뉴클레아제활성을 가질 수 있다는 사실에도 불구하고, 어떤 적용의 경우, Cas 단백질의 비변성 뉴클레아제활성을 비활성화시키고, Cas 단백질 또는 리보핵산 단백질 복합체를 제공하는 것이 바람직할 수 있으며, 여기서, 비변성 Cas9 뉴클레아제활성은 비활성화되고, 및 Cas 단백질은 적어도 하나의 기능성 모이어티에 연결된다. 비변성 Cas9 뉴클레아제활성의 상보성에 의한 불일치-표적화 사건의 발생률을 감소시키는 것은, 이러한 적용 중 하나이다. 이는, 바람직하게는, Cas 단백질 또는 리보핵산 단백질 복합체의 비변성 Cas9 뉴클레아제활성의 비활성화 및 Cas 단백질에 바람직하게 융합된, 이종 뉴클레아제의 제공에 의해 달성될 수 있다. 따라서, 본 발명은 Cas 단백질 또는 리보핵산 단백질 복합체를 제공하고, 여기서, 적어도 하나의 기능성 모이어티는 뉴클레아제도메인, 바람직하게는, FokI 뉴클레아제도메인이다. 특히 바람직한 관점에서, FokI 뉴클레아제도메인에 융합된 본 발명의 Cas 단백질 또는 리보핵산 단백질 복합체는, 바람직하게는, FokI 뉴클레아제도메인에 융합된 본 발명의 또 다른 Cas 단백질 또는 리보핵산 단백질 복합체를 포함하는, 단백질 복합체의 일부로서 제공되며, 여기서 2개의 복합체는 표적 게놈 DNA의 대립 가닥 (opposite strands)을 표적으로 한다.
몇몇 적용의 경우, 예를 들어, Cas 단백질 또는 리보핵산 단백질 복합체가, 예를 들어, 진단 시험의 일부로 이를 표지하기 위해, 핵산에서 특이적 표적 서열을 인지하고, 변형시키는데 활용되는 적용에서, Cas 단백질, 폴리펩티드 또는 리보핵산 단백질의 뉴클레아제활성을 완전히 약화시키는 것이 바람직할 수 있다. 이러한 적용에서, Cas 단백질의 뉴클레아제활성은 비활성화될 수 있고, 및 Cas 단백질에 융합된 기능성 모이어티는; 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라아제, 포스페타아제, 키아나제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치 측정 서열, 항체 에피토프 또는 친화성 정제태그로부터 선택적으로 선택된, 단백질일 수 있다.
바람직한 관점에서, 뉴클레아제활성이 결핍된 효소의 기능이 없는, 또는 "죽은" Cas 단백질 또는 폴리펩티드 (dCas)는, 표적 핵산 서열에 결합될 수 있고, 이에 의해 그 서열의 활성을 입체구조로 억제할 수 있다. 예를 들어, 표적화 RNA는 유전자의 프로모터 또는 엑손 서열에 상보적인 것으로 디자인될 수 있어서, 유전자에 dCas 및 표적화 RNA의 결합이 유전자 서열의 전사적 개시 (transcriptional initiation) 또는 신장 (elongation)을 입체구조로 억제하고, 이에 의해 유전자의 발현을 억제한다. 선택적으로, 여기에 기재된 방법 및 사용은, 니카제(nickases)인 gtCas9의 변형된 뉴클레아제변이체를 사용할 수 있다. 니카제는 gtCas9 뉴클레아제의 HNH 또는 RuvC 촉매 도메인 중 어느 하나에서 돌연변이를 통해 생성될 수 있다. 이것은, 각각, 비활성 RuvC 또는 HNH 뉴클레아제도메인을 갖는, spCas9-돌연변이체 D10A 및 H840A를 갖는 S. pyogenes Cas9 (spCas)에 대해 나타낸다. 이들 2개의 돌연변이의 조합은, 촉매적으로 죽은 Cas9 변이체 (dead Cas9 variant)로 이어진다 (Standage-Beier, K. et al., 2015, ACS Synth. Biol. 4, 1217-1225; Jinek, M. et al., 2012, Science 337, 816-821, Xu, T.et al., 2015, Appl. Environ.Microbiol.81, 4423-4431). 서열 상동성 (도 3)에 기초하여, 이들 잔기는 gtCas9에서 D8 (도 3의 D17) 및 D581 또는 H582 (도 3)일 수 있다. 바람직하게는, gtCas9에서 돌연변이 D8A 및 H582A (ThermoCas9)는, 뉴클레아제활성이 결핍된, ThermoCas9의 촉매적으로 비활성, 또는 "죽은" Cas 단백질 또는 폴리펩티드 변이체 (dCas)를 생성하는데 사용될 수 있다. 이러한 dCas는, 예를 들어, dsDNA 절단을 도입하지 않고 정상적이고 명확히 DNA 인자 (DNA elements)에 결합할 수 있는, 효과적인 열활성 전사 침묵 CRISPRi 도구로서, 적용을 유용하게 발견할 수 있다. 유리하게도, 이러한 시스템은, 다른 것들 중에서, 호열성 미생물의 대사 연구를 크게 촉진시킬 수 있다.
특히 바람직한 관점에서, 본 발명은 Cas 단백질 또는 리보핵산 단백질 복합체를 제공하고, 여기서, 상기 Cas 단백질의 뉴클레아제활성은 비활성화되고, 적어도 하나의 기능성 모이어티는 마커 단백질, 예를 들어, GFP이다. 이러한 방식에서, 관심의 핵산 서열을 구체적으로 표적화하고, 및 광학 신호를 발생하는 마커를 사용하여 이를 시각화하는 것은 가능할 수 있다. 적절한 마커는, 예를 들어, 형광 리포터 단백질, 예를 들어, 녹색 형광 단백질 (GFP), 황색 형광 단백질 (YFP), 적색 형광 단백질 (RFP), 시안 형광 단백질 (CFP) 또는 mCherry을 포함할 수 있다. 이러한 형광 리포터 유전자는, 이의 발현이 형광 측정에 의해 간단하고 즉시 분석될 수 있기 때문에, 단백질 발현의 시각화를 위한 적절한 마커를 제공한다. 선택적으로, 리포터 핵산은 루시퍼라제(예를 들어, 반딧불이 루시퍼라제(firefly luciferase))와 같은, 발광 단백질을 인코딩할 수 있다. 선택적으로, 리포터 유전자는 광학 신호를 발생하는데 사용될 수 있는, 발색 효소 (chromogenic enzyme), 예를 들어, (베타-갈락토시다아제(LacZ) 또는 베타-글루쿠로니다아제(Gus)와 같은) 발색 효소일 수 있다. 발현의 측정에 사용되는 리포터는 또한 항원 펩티드 태그일 수 있다. 다른 리포터 또는 마커는 당업계에 공지되어 있으며, 이들은 적절하게 사용될 수 있다.
마커가 시각화될 수 있기 때문에, 표적 핵산이 RNA, 특히 mRNA인 어떤 구체 예에서, 특히 마커에 의해 발생된 광학 신호가 발현 산물의 양에 직접적으로 비례하는 경우, 마커에 의해 제공된 광학 신호의 검출 및 정량화에 의해, 유전자의 전사 활성을 정량화하는 것은 가능하다. 따라서, 본 발명의 바람직한 구체 예에서, 본 발명의 Cas 단백질 또는 리보핵산 단백질은, 관심의 유전자의 발현 산물을 분석하는데 사용될 수 있다.
하나의 관점에서, 여기에 기재된 gtCas9는, 미생물 세포에서의 상동 재조합 (HR) 매개된 게놈 변형 방법에 사용될 수 있다. 이러한 방법은 HR 및 부위-인도 gtCas9 활성을 포함하며, 이에 의해 반대 선택 (counter selection)은 HR에 의해 도입된 원하는 변형을 갖지 않는 미생물을 제거하는 gtCas9 활성에 의해 일어난다.
따라서, 여기에 제공된 방법 및 사용은 미생물 게놈이 원하는 돌연변이로 변형될 수 있는 제1 단계 및 미변형 세포가 gtCas9 리보뉴클레아제복합체에 의해 표적화되어 미변형 세포의 게놈으로 DSDB를 도입할 수 있는 제2 단계 동안 선호되는 상동 재조합의 공정을 가능하게 한다. 대다수의 미생물에서 효율적인 비-상동성 말단 연결 (NHEJ) 복구 기작이 없기 때문에, DSDB는 통상적으로 세포 죽음으로 이어진다. 따라서, 이들 방법 및 사용은 미변형 미생물 세포를 제거하면서 원하는 돌연변이를 갖는 미생물 세포의 개체군을 전반적으로 증가시킨다. 바람직하게는, 이러한 방법 및 사용은 실질적으로 내인성 NHEJ 복구 메카니즘을 갖지 않은 미생물에서 사용된다. 선택적으로, 상기 방법 및 사용은 내인성 NHEJ 복구 메카니즘을 갖는 미생물에 적용될 수 있다. 여기에 기재된 방법 및 사용은 내인성 NHEJ 복구 메카니즘을 갖는 미생물에 적용될 수 있지만, 여기서, 상기 NHEJ 복구 메카니즘은 조건부로 감소되거나 또는 NHEJ 활성은 녹아웃된다 (knocked out).
여기에 제공된 방법 및 사용은, 가이드 RNA가 변형된 게놈을 더 이상 인식할 수 없도록, 가이드 RNA와 적어도 하나의 불-일치를 갖는 상동 재조합 폴리뉴클레오티드의 서열을 활용할 수 있다. 이것은 gtCas9 리보뉴클레아제복합체가 변형된 게놈을 인식하지 못한다는 것을 의미한다. 따라서, DSDB는 gtCas9 리보뉴클레아제복합체에 의해 도입될 수 없으므로, 변형된 세포는 생존할 것이다. 그러나, 미변형 게놈을 갖는 세포는, 여전히 가이드 RNA에 실질적인 상보성을 가지며, 결과적으로 gtCas9 리보뉴클레아제복합체에 의해 부위-특이적으로 절단될 수 있다.
본 발명의 방법 및 사용의 또 다른 관점에서, gtCas9 리보뉴클레아제복합체가 미생물 게놈을 절단하는 작용을 방해하는 방식은, 가이드에 의해 표적화된 서열을 변형시키거나 제거하는 것과 큰 관련이 없고, 오히려 gtCas9 리보뉴클레아제복합체가 필요로 하는 PAM을 변형시키거나 제거하는 것이다. PAM은 특이적 절단 부위에 gtCas9 리보뉴클레아제복합체를 블라인드 (blind)하기 위해 변형되거나 제거된다. 따라서, 본 발명의 방법 및 사용은 gtCas9 리보뉴클레아제복합체에 의해 인식되는 PAM 서열을 포함하지 않는 상동 재조합 폴리뉴클레오티드의 서열을 사용하는 방법을 포함할 수 있다. 따라서, DSDB는 gtCas9 리보뉴클레아제복합체에 의해 도입될 수 없으므로, HR 변형된 세포는 생존할 것이다. 그러나, 미변형 세포는, gtCas9 리보뉴클레아제복합체 및 이의 가이드에 의해 여전히 인식될 것이고, 결과적으로 부위-특이적으로 절단될 것이다.
따라서, 미생물의 게놈을 변형시키기 위해 HR에 의존하는 방법 및 사용은 여기에 제공된다. 바람직하게는, 업스트림 플랜크 (upstream flank) 및 다운스트림 플랜크는 길이가 각각 0.5kb (kilobases) 내지 1.0 kb이다. 그러나, 더 크거나 더 짧은 단편을 사용하는 재조합은 또한 가능하다. 상동 재조합 폴리뉴클레오티드는 업스트림과 다운스트림 플랜킹 영역들 사이에 폴리뉴클레오티드 서열을 더욱 포함할 수 있다. 이 폴리뉴클레오티드 서열은, 예를 들어, 미생물 게놈으로 도입될 변형을 함유할 수 있다.
상동 재조합은 표적 영역에 실질적인 상보성을 갖는 업스트림 및 다운스트림 플랜크에 의존하지만, 불일치도 또한 수용될 수 있다. 따라서, 몇몇 구체 예에서, 상동 재조합은 업스트림 및 다운스트림 플랜크에 광범위한 상동성을 갖는 DNA 세그먼트 (segments) 사이에 일어나는 것으로 알려져 있다. 선택적인 구체 예에서, 업스트림 및 다운스트림 플랜크는 표적 영역에 완전한 상보성을 갖는다. 업스트림 및 다운스트림 플랜크는 크기가 동일할 필요는 없다. 그러나, 몇몇 사례에서, 업스트림 및 다운스트림 플랜크는 크기가 동일하다. 상동 재조합의 효율은 플랜크의 가장 작은 단편 길이의 상동 재조합의 가능성에 매우 의존할 것이다. 그러나, 상동 재조합 공정이 비효율적일지라도, 유리하게는, 여기서 기재된 방법은 미변형 미생물 세포에 대해 원하는 변형을 갖는 임의의 미생물 세포를 선택할 것이다. 상동 재조합은 또한 완전한 유전자 클러스터 (gene clusters)를 둘러싸게 만드는 큰 결손 (예를 들어, 50kb 이상)을 가능하게 한다. 상동 재조합은 재조합공학 (recombineering)에도 사용되며, 이것은 더 작은 단편 (45-100 nt)에 대한 재조합을 가능하게 하는 잘-알려진 방법이다. 여기에 기재된 방법 및 사용은 선택적으로 미생물 게놈에서 표적을 함유하는 제2 표적 영역에 실질적으로 상보적인 서열을 갖는 상동 재조합 폴리뉴클레오티드를 인코딩하는 서열을 포함하는 폴리뉴클레오티드 또는 적어도 또 다른 상동 재조합 폴리뉴클레오티드를 더욱 포함할 수 있다.
바람직한 구체 예에서, 여기에 기재된 방법 및 사용은, DNA인 상동 재조합 폴리뉴클레오티드를 활용한다. 몇몇 구체 예에서, DNA는 단일 가닥이다. 다른 구체 예에서, DNA는 이중 가닥이다. 또 다른 구체 예에서, DNA는 이중 가닥 및 플라스미드 유래 (plasmid borne)이다.
여기에 제공된 방법 및 사용에서 HR은 미생물 게놈으로부터 폴리뉴클레오티드 서열을 제거하는데 사용될 수 있다. 선택적으로, 여기에 제공된 방법 및 사용에서 HR은 미생물 게놈에, 하나 이상의 유전자(들), 또는 이의 단편(들)을 삽입하는데 사용될 수 있다. 또 다른 대안으로서, 여기에 제공된 방법 및 사용에서 HR은, 미생물 게놈에서 적어도 하나의 뉴클레오티드를 변형 또는 치환하는데 사용될 수 있다. 결과적으로, 여기에 제공된 방법 및 사용은, 임의의 원하는 종류의 게놈 변형을 위해 사용될 수 있다.
선택적으로, 여기서 기재된 gtCas9는, 미생물 세포에서 HR 매개된 게놈 변형 방법에 사용될 수 있고, 이에 의해, gtCas9 활성은, spCas9에 대해 나타낸 바와 같이, DSDB를 도입하고, 미생물 세포에서 세포의 HR (cellular HR)을 유도할 수 있다 (Jiang et al. (2013) Nature Biotech, 31, 233-239; Xu et al. (2015) Appl Environ Microbiol, 81, 4423-4431; Huang et al. (2015) Acta Biochimica et Biophysica Sinica, 47, 231-243).
선택적으로, 상동 재조합은 재조합공학을 통해, 예를 들어, Mougiakos 등 ((2016), Trends Biotechnol. 34: 575-587)에 의해 검토된 바와 같은, RecT 또는 베타 단백질을 인코딩하는 유전자를 발현하는 미생물 세포 내로 올리고뉴클레오티드를 도입시켜, 가능하게 할 수 있다. 또 다른 구체 예에서, Cas9는 Ronda 등 ((2016), Sci. Rep., 6: 19452)에 의해 예증된 바와 같이, Multiplex Automated Genome Engineering (MAGE)과 조합될 수 있다.
모든 부분에서, 본 발명의 Cas 단백질의 참조 서열은, 아미노산 서열을 인코딩하는 뉴클레오티드 서열로서 정의될 수 있다. 예를 들어, SEQ ID NO: 2 내지 6에 정의된 모티프의 아미노산 서열은 또한 그 아미노산 서열을 인코딩하는 모든 핵산 서열을 포함한다.
따라서, 본 발명은 또한 다음을 포함하는 Cas 단백질을 인코딩하는 단리된 핵산 분자를 제공한다:
a. 아미노산 모티프 EKDGKYYC [SEQ ID NO: 2]; 및/또는
b. 아미노산 모티프 X1X2CTX3X4 [SEQ ID NO: 3], 여기서, X1은 이소류신, 메티오닌 또는 프롤린으로부터 독립적으로 선택되고, X2는 발린, 세린, 아스파라긴 또는 이소류신으로부터 독립적으로 선택되며, X3는 글루타메이트 또는 리신으로부터 독립적으로 선택되고, 또는 X4는 알라닌, 글루타메이트 또는 아르기닌 중 하나임; 및/또는
c. 아미노산 모티프 X5LKX6IE [SEQ ID NO: 4], 여기서, X5는 메티오닌 또는 페닐알라닌으로부터 독립적으로 선택되고, 및 X6는 히스티딘 또는 아스파라긴으로부터 독립적으로 선택됨; 및/또는
d. 아미노산 모티프 X7VYSX8K [SEQ ID NO: 5], 여기서, X7은 글루타메이트 또는 이소류신이고, 및 X8은 트립토판, 세린 또는 리신 중 하나임; 및/또는
e. 아미노산 모티프 X9FYX10X11REQX12KEX13 [SEQ ID NO: 6], 여기서, X9는 알라닌 또는 글루타메이트이고, X10은 글루타민 또는 리신이며, X11은 아르기닌 또는 알라닌이고, X12는 아스파라긴 또는 알라닌이며, 및 X13은 리신 또는 세린이고;
여기서, Cas 단백질은, 적어도 하나의 표적화 RNA 분자, 및 상기 표적화 RNA 분자에 의해 인지되는 표적 핵산 서열을 포함하는 폴리뉴클레오티드와 결합되는 경우, 50℃ 내지 100℃에서 DNA 결합, 절단, 표지 또는 변형할 수 있다.
다른 관점에서, 본 발명은 또한, SEQ ID NO: 1의 아미노산 서열 또는 이와 적어도 77% 동일성의 서열을 갖는 일정한 간격을 두고 주기적으로 분포하는 짧은 회문구조 반복서열 (CRISPR)-관련 (Cas) 단백질을 인코딩하는 단리된 핵산 분자를 제공한다.
또 다른 관점에서, 본 발명은 또한, 번역시에 Cas 단백질에 융합되는 펩티드를 인코딩하는 적어도 하나의 핵산 서열을 더욱 포함하는, 단리된 핵산 분자를 제공한다.
또 다른 관점에서, 본 발명은 또한 단리된 핵산 분자를 제공하며, 여기서, Cas 단백질을 인코딩하는 핵산 분자에 융합된 적어도 하나의 핵산 서열은, 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라제, 포스파타아제, 키나아제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치정보 서열, 항체 에피토프 또는 친화성 정제태그로부터 선택된 단백질을 인코딩한다.
ThermoCas9 뉴클레아제활성: 2가 양이온
사전에 특징화된, 중온성 Cas9 엔도뉴클레아제는, 표적 DNA에서 DSBs의 발생을 촉진하기 위해 2가 양이온을 사용한다. 본 발명자들은, ThermoCas9가 다음의 이가 양이온: Mg2+, Ca2+, Mn2+, Co2+, Ni2+, 및 Cu2+ 중 어느 하나의 존재하에서 dsDNA 절단을 매개할 수 있다는 것을 밝혀냈다.
ThermoCas9 뉴클레아제활성: 기질
본 발명자들은 또한, 놀랍게도, 어떤 타입-ⅡC 시스템이 효율적인 단일 가닥 DNA 가위 (DNA cutter)라는 보고 ((Ma, et al., Mol. Cell 60, 398-407 (2015); Zhang, et al., Mol. Cell 60, 242-255 (2015))에도 불구하고, ThermoCas9가 ssDNA의 절단을 지시할 수 없음을 밝혀냈다. ThermoCas9의 뉴클레아제활성은 dsDNA 기질에 제한된다.
발현 벡터 (Expression Vectors)
본 발명의 핵산은 단리될 수 있다. 그러나, 핵산 센싱 구축물의 발현이 선택 세포에서 수행될 수 있게 하기 위해, Cas 단백질 또는 리보핵산 단백질을 인코딩하는 폴리뉴클레오티드 서열은, 바람직하게는, 발현 구축물에 제공될 것이다. 몇몇 구체 예에서, Cas 단백질 또는 리보핵산 단백질을 인코딩하는 폴리뉴클레오티드는, 적절한 발현 벡터의 일부로서 제공될 것이다. 어떤 구체 예에서, (발현시 Cas 단백질에 융합되는 아미노산 잔기를 인코딩하는 뉴클레오티드 서열을 갖거나 또는 갖지 않는) 본 발명의 발현 벡터는, 전술된 바와 같은 표적화 RNA 분자를 인코딩하는 뉴클레오티드 서열을 더욱 포함할 수 있다. 결과적으로, 이러한 발현 벡터는, 적절한 숙주에서 사용되어, 원하는 뉴클레오티드 서열을 표적으로 할 수 있는 본 발명의 리보핵산 단백질 복합체를 발생시킬 수 있다. 선택적으로, 전술된 바와 같은 표적화 RNA 분자를 인코딩하는 뉴클레오티드 서열은, 개별 발현 벡터에 제공될 수 있거나 또는 선택적으로 다른 수단에 의해 표적 세포로 전달될 수 있다.
적절한 발현 벡터는, 수용 세포 (recipient cell)에 따라 변할 수 있으며, 및 표적 세포에서 발현이 가능하고 및 바람직하게는, 높은-수준의 발현을 용이하게 하는 조절 인자 (regulatory element)를 적절하게 혼입할 수 있다. 이러한 조절 서열 (regulatory sequences)은, 예를 들어, 개시 (initiation), 정확도, 속도, 안정성, 다운스트림 공정 및 이동성의 관점에서, 유전자 또는 유전자 산물의 전사 또는 번역에 영향을 미칠 수 있다.
이러한 인자는, 예를 들어, 강한 및/또는 구성적 프로모터, 5' 및 3' UTR's, 전사 및/또는 번역 인핸서 (enhancers), 전사 인자 또는 단백질 결합 서열, 시작 부위 및 종결 서열, 리보좀 결합 부위, 재조합 부위, 폴리아데닐화 서열, 센스 또는 안티센스 서열, 전사의 정확한 개시를 보장하는 서열 및 선택적으로 숙주 세포에서 전사 및 전사 안정화의 종결을 보장하는 폴리-A 신호를 포함할 수 있다. 조절 서열은 식물-, 동물-, 박테리아-, 곰팡이- 또는 바이러스 유래일 수 있고, 및 바람직하게는, 숙주 세포와 동일한 유기체로부터 유래될 수 있다. 분명히, 적절한 조절 인자는, 관심의 숙주 세포에 따라 변할 것이다. 예를 들어, E. coli와 같은 원핵생물 숙주 세포에서 높은-수준의 발현을 용이하게 하는 조절 인자는, pLac, T7, P(Bla), P(Cat), P(Kat), trp 또는 tac 프로모터를 포함할 수 있다. 진핵생물 숙주 세포에서 높은-수준의 발현을 용이하게 하는 조절 인자는, 효모에서 AOX1 또는 GAL1 프로모터 또는 CMV- 또는 SV40-프로모터, CMV-인핸서, SV40-인핸서, Herpes simplex virus VIP16 전사 활성인자 또는 동물세포에서 글로빈 인트론 (globin intron)의 함유물 (inclusion)을 포함할 수 있다. 식물에서, 구성적 높은-수준의 발현은, 예를 들어, Zea mays 유비퀴틴 1 프로모터 또는 콜리플라워 모자이크 바이러스 (cauliflower mosaic virus)의 35S 및 19S 프로모터를 사용하여 얻을 수 있다.
적절한 조절 인자는 구성적 (constitutive)일 수 있고, 이에 의해 이들은, 대부분의 환경 조건 또는 발생 단계 (developmental stages), 발생 단계 특이성 또는 유도성 하에서 발현을 지시한다. 바람직하게는, 프로모터는 유도성이어서, 온도, 빛, 화학제, 건조 (drought) 및 다른 자극과 같은, 환경적, 화학적 또는 발생적 신호 (cues)에 반응하여 발현을 지시한다. 적절하게, 프로모터는, 특정 발생 단계에서 또는 세포-외 또는 세포-내 조건, 신호 또는 외부에서 가해진 자극에 반응하여, 관심의 단백질의 발현을 가능하게 선택될 수 있다. 예를 들어, 특정 성장 단계 (예를 들어, osmY 정지상 프로모터)에서 또는 특정 자극 (예를 들어, HtpG Heat Shock Promoter)에 반응하여, 높은-수준의 발현을 제공하는 E. coli에서 사용하기 위한 다양한 프로모터는 존재한다.
적절한 발현 벡터는 적절한 숙주 세포에서 및/또는 특정 조건하에서 상기 벡터의 선택을 가능하게 하는 선택 가능한 마커를 인코딩하는 부가적인 서열을 포함할 수 있다.
본 발명은 또한 세포를 전술된 바와 같은 발현 벡터 중 어느 하나로 형질주입 (transfecting), 형질전환 (transforming) 또는 형질도입 (transducing)하는 것을 포함하는, 세포에서 표적 핵산을 변형시키는 방법을 포함한다. 형질주입, 형질전환, 또는 형질도입의 방법은 기술분야의 당업자에게 잘 알려진 타입들이다. 본 발명의 리보핵산 단백질 복합체의 발현을 발생하는데 사용되는 하나의 발현 벡터가 존재하고, 표적화 RNA가 세포에 직접 첨가되는 경우, 그 다음, 형질주입, 형질전환 또는 형질도입의 같거나 또는 다른 방법은 사용될 수 있다. 유사하게, 본 발명의 리보핵산 단백질 복합체의 발현을 발생하기 위해 사용되는 하나의 발현 벡터가 존재하고, 및 또 다른 발현 벡터가 발현을 통해 인시튜 (in situ)로 표적화 RNA를 발생시키는데 사용되는 경우, 그 다음, 형질주입, 형질전환, 또는 형질도입의 같거나 또는 다른 방법은 사용될 수 있다.
다른 구체 예에서, Cas 단백질 또는 폴리펩티드를 인코딩하는 mRNA는, 캐스케이드 복합체 (Cascade complex)가 세포에서 발현되도록, 세포 내로 도입된다. Cas 단백질 복합체를 원하는 표적 서열로 안내하는 표적화 RNA는 또한, 필요한 리보핵산 단백질 복합체가 세포에서 형성되도록, mRNA와 동시에, 개별적으로 또는 순차적으로, 세포 내로 도입된다.
따라서, 본 발명은 또한 전술된 바와 같은 리보핵산 단백질 복합체와 핵산을 접촉시키는 단계를 포함하는, 표적 핵산을, 변형, 즉, 절단, 태깅, 변형, 표지 또는 결합하는 방법을 제공한다.
부가적으로, 본 발명은 또한, 전술된 바와 같은 표적화 RNA 분자에 부가하여, 전술된 바와 같은 Cas 단백질 또는 폴리펩티드와 핵산을 접촉시키는 단계를 포함하는 표적 핵산을 변형시키는 방법을 포함한다.
상기 방법들에 따르면, 표적 핵산의 변형은, 따라서, 시험관에서 및 무-세포 환경에서 수행될 수 있다. 무-세포 환경에서, 표적 핵산, Cas 단백질 및 표적화 RNA 분자의 각각의 첨가는, 동시에, 순차적으로 (원하는 대로의 임의의 순서로) 또는 개별적으로 이루어질 수 있다. 따라서, 표적 핵산 및 표적화 RNA를 반응 혼합물에 동시에 첨가한 다음, 본 발명의 Cas 단백질 또는 폴리펩티드를 후속 단계에서 개별적으로 첨가하는 것이 가능하다.
마찬가지로, 표적 핵산의 변형은, 단리된 세포이든 또는 다세포 조직, 기관 또는 유기체의 일부이든 간에, 생체내에서, 즉, 세포에서 인시튜로 이루어질 수 있다. 전체 조직 및 기관의 맥락에서, 및 유기체의 맥락에서, 상기 방법은 바람직하게는, 생체 내에서 수행될 수 있거나, 또는 선택적으로, 전체 조직, 기관 또는 유기체 유래의 세포를 단리하는 단계, 상기 방법에 따라 리보핵산 단백질 복합체로 세포를 처리하는 단계, 및 그 후에 리보핵산 단백질 복합체로 처리된 세포를, 같거나 또는 다른 유기체 내에서, 이의 이전 위치 또는 다른 위치로 복귀시키는 단계에 의해 수행될 수 있다.
이들 구체 예에서, 리보핵산 단백질 복합체 또는 Cas 단백질 또는 폴리펩티드는, 세포 내로 적절한 형태의 전달을 필요로 한다. 이러한 적절한 전달 시스템 및 방법은, 당업자에게 잘 알려져 있으며, 및 세포질 또는 핵 미세주입 (nuclear microinjection)을 포함하지만, 이에 제한되는 것은 아니다. 바람직한 전달 방식에서, 아데노-연관 바이러스 (AAV)는 사용되고; 이 전달 시스템은, 사람에게 질병을 일으키지 않으며, 유럽에서 임상적 사용이 승인되었다.
따라서, 본 발명은:
a. 전술된 바와 같은 리보핵산 단백질 복합체; 또는
b. 전술된 바와 같은 단백질 또는 단백질 복합체 및 전술된 바와 같은 RNA 분자와 핵산을 접촉시키는 단계를 포함하는 표적 핵산을 변형시키는 방법을 제공한다.
또 다른 관점에서, 본 발명은 전술된 바와 같은 리보핵산 단백질 복합체를 인코딩하는 뉴클레오티드 서열을 포함하는 발현 벡터로 세포를 형질전환, 형질주입, 또는 형질도입하는 단계를 포함하는, 세포에서 표적 핵산을 변형시키는 방법을 제공하거나; 또는 선택적으로 전술된 바와 같은 단백질 또는 단백질 복합체를 인코딩하는 뉴클레오티드 서열을 포함하는 발현 벡터 및 전술된 바와 같은 표적화 RNA 분자를 인코딩하는 뉴클레오티드 서열을 포함하는 추가 발현 벡터로 세포를 형질전환, 형질주입 또는 형질도입시키는 단계를 포함한다.
또 다른 관점에서, 본 발명은, 전술된 바와 같은 단백질 또는 단백질 복합체를 인코딩하는 뉴클레오티드 서열을 포함하는 발현 벡터로 세포를 형질전환, 형질주입 또는 형질도입하는 단계, 및 그 다음 전술된 바와 같이 표적화 RNA 분자를 세포 내로 전달하는 단계를 포함하는 표적 핵산을 변형시키는 방법을 제공한다.
가이드 (즉, 표적화) RNA (gRNA) 분자 및 Cas 단백질 또는 폴리펩티드가 리보핵산 단백질 복합체의 일부로서가 아닌 별도로 제공되는 구체 예에서, gRNA 분자는, Cas 단백질 또는 단백질 복합체와 동시에, 개별적으로 또는 순차적으로, 세포 내로 적절한 형태의 전달을 필요로 한다. 세포 내로 RNA를 도입시키는 이러한 형태는, 기술분야의 당업자에게 잘 알려져 있으며, 및 종래의 형질주입 방법을 통해 시험관 내 또는 생체 외 전달을 포함할 수 있다. 미세주입 및 전기천공법과 같은, 물리적 방법뿐만 아니라 칼슘 공-침전, 및 상업적으로 이용 가능한 양이온성 중합체 및 지질, 및 세포-침투 펩티드, 세포-침투 (유전자총 (biolistic)) 입자는, 각각 사용될 수 있다. 예를 들어, 바이러스, 특히 바람직하게는, AAV는, 예를 들어, 바이러스성 입자에 본 발명의 Cas 단백질 복합체 또는 본 발명의 리보핵산 단백질 복합체의 (가역성) 융합을 통해, 세포질이든 및/또는 핵이든, 전달 비히클 (delivery vehicles)로서 사용될 수 있다.
또 다른 관점에서, 본 발명은 표적 핵산을 변형시키는 방법을 제공하며, 여기서, 적어도 하나의 기능성 모이어티는 마커 단백질 또는 리포터 단백질이고, 상기 마커 단백질 또는 리포터 단백질은 표적 핵산과 결합하며; 바람직하게는, 여기서, 상기 마커는 형광 단백질, 예를 들어, 녹색 형광 단백질 (GFP)이다.
표적 핵산을 변형시키는 전술된 방법에서, 기능성 모이어티는 마커일 수 있고, 상기 마커는 표적 핵산과 결합하며; 바람직하게는, 여기서 상기 마커는 단백질; 선택적으로 형광 단백질, 예를 들면, 녹색 형광 단백질 (GFP), 황색 형광 단백질 (YFP), 적색 형광 단백질 (RFP) 또는 mCherry이다. 시험관 내, 생체 외 또는 생체 내를 불문하고, 본 발명의 방법은, 바람직하게는, 슈퍼코일화된 플라스미드 (supercoiled plasmid) 또는 염색체와 같은, 고차 구조, 또는 mRNA과 같은 단일 가닥 표적 핵산의 형태로, 핵산 분자 내에 표적 유전자좌를 직접적으로 시각화하는데 사용될 수 있다. 표적 유전자좌의 직접 시각화는 전자 현미경, 또는 형광 현미경을 사용할 수 있다. 그러나, 본 발명의 방법의 맥락에서, 다른 종류의 라벨 (label)이, 유기 염료 분자, 동정용 방사성 동위원소 (radiolabels) 및 소분자일 수 있는 스핀 라벨 (spin labels)을 포함하는 마커로서 사용될 수 있는 것으로 인정될 것이다.
표적 핵산이 dsDNA인 표적 핵산을 변형시키는 본 발명의 방법에서, 기능성 모이어티는 뉴클레아제또는 헬리카제-뉴클레아제일 수 있고, 및 상기 변형은 바람직하게는, 원하는 유전자좌에서 단일 가닥 또는 이중 가닥 절단이다. 이러한 방식에서, DNA의 독특한 서열 특이적 절단은, 리보핵산 단백질 복합체에 융합된 적절한 기능성 모이어티를 사용하여 조작될 수 있다. 최종 리보핵산 단백질 복합체의 RNA 성분의 선택 서열은, 기능성 모이어티의 작용을 위한 원하는 서열 특이성을 제공한다.
따라서, 본 발명은 또한 dsDNA 분자로부터 뉴클레오티드 서열의 적어도 일부를 제거하기 위해; 선택적으로 유전자 또는 유전자들의 기능을 녹아웃되게 하기 위해, 원하는 유전자좌에 세포에서 dsDNA 분자의 비-상동 말단 연결 (non-homologous end joining) 방법을 제공하며; 여기서, 상기 방법은 전술된 바와 같은 표적 핵산을 변형시키는 방법들 중 어느 하나를 사용하여 이중 가닥 절단을 만드는 단계를 포함한다.
본 발명은 기존의 뉴클레오티드 서열을 변형시키거나 또는 원하는 뉴클레오티드 서열을 삽입하기 위해 원하는 유전자좌에 세포에서 dsDNA 분자 내로 핵산의 상동 재조합시키는 방법을 더욱 제공하며, 여기서, 상기 방법은 전술된 바와 같은 표적 핵산을 변형시키는 방법들 중 어느 하나를 사용하여 원하는 유전자좌에 이중 가닥 절단을 만드는 단계를 포함한다.
따라서, 본 발명은 또한 전술된 방법들 중 어느 하나에 따라 표적 핵산 서열을 변형시키는 단계를 포함하는 유기체에서 유전자 발현을 변형시키는 방법을 제공하며, 여기서, 상기 핵산은 dsDNA이고, 기능성 모이어티는 DNA 변형 효소 (예를 들어, 메틸라아제또는 아세틸라제), 전사 활성인자 또는 전사 억제인자로부터 선택된다.
본 발명은 부가적으로 전술된 방법들 중 어느 하나에 따라 표적 핵산 서열을 변형시키는 단계를 포함하는 유기체에서 유전자 발현을 변형시키는 방법을 제공하며, 여기서, 상기 핵산은 mRNA이고, 기능성 모이어티는 리보뉴클레아제이며; 선택적으로 엔도뉴클레아제, 3' 엑소뉴클레아제또는 5' 엑소뉴클레아제로부터 선택된다.
표적 핵산은 DNA, RNA 또는 합성 핵산일 수 있다. 바람직하게는, 표적 핵산은 DNA; 바람직하게는, dsDNA이다.
그러나, 표적 핵산은 RNA; 바람직하게는, mRNA일 수 있다. 따라서, 선택적으로, 본 발명은 또한 표적 핵산을 변형시키는 방법을 제공하며, 여기서 상기 표적 핵산은 RNA이다.
또 다른 관점에서, 본 발명은 표적 핵산을 변형시키는 방법을 제공하며, 여기서, 핵산은 dsDNA이고, 적어도 하나의 기능성 모이어티는 뉴클레아제또는 헬리카제-뉴클레아제이며, 및 상기 변형은 원하는 유전자좌에서 단일-가닥 또는 이중-가닥 절단이다.
또 다른 관점에서, 본 발명은 세포에서 표적 핵산을 변형시키는 방법을 제공하며, 여기서 변형은 원하는 유전자좌에서 유전자 발현의 침묵을 결과하고; 및 여기서 상기 방법은:
a. dsDNA 분자에서 이중-가닥 절단을 만드는 단계; 및
b. 비-상동 말단 재조합 (NHEJ)에 의해 세포에서 dsDNA 분자의 복구 단계를 포함한다.
또 다른 관점에서, 본 발명은 세포에서 표적 핵산을 변형시키는 방법을 제공하며; 여기서, 기존의 뉴클레오티드 서열이 변형 또는 결손되고 및/또는 원하는 뉴클레오티드 서열이 원하는 위치에 삽입되며, 여기서 상기 방법은:
a. 원하는 유전자좌에서 이중 가닥 절단을 만드는 단계; 및
b. 상동 재조합에 의해 세포에서 dsDNA 분자의 복구 단계를 포함한다.
또 다른 관점에서, 본 발명은 전술된 바와 같은 표적 핵산 서열을 변형시키는 단계를 포함하는 세포에서 유전자 발현을 변형시키는 방법을 제공하고; 여기서, 상기 핵산은 dsDNA이며, 및 상기 기능성 모이어티는 DNA 변형 효소 (예를 들어, 메틸라아제또는 아세틸라제), 전사 활성인자 또는 전사 억제인자로부터 선택된다.
또 다른 관점에서, 본 발명은 전술된 바와 같은 표적 핵산 서열을 변형시키는 단계를 포함하는 세포에서 유전자 발현을 변형시키는 방법을 제공하며, 여기서, 상기 핵산은 mRNA이고, 상기 기능성 모이어티는 리보뉴클레아제이며; 선택적으로 엔도뉴클레아제, 3' 엑소뉴클레아제또는 5' 엑소뉴클레아제로부터 선택된다.
또 다른 관점에서, 본 발명은, 전술된 바와 같은 표적 핵산을 변형시키는 방법을 제공하며, 여기서 상기 방법은 45℃ 내지 100℃의 온도에서 수행된다. 바람직하게는, 상기 방법은 50℃ 이상의 온도에서 수행된다. 좀 더 바람직하게는, 상기 방법은 55℃ 내지 80℃의 온도에서 수행된다. 최적으로, 상기 방법은 60℃ 내지 65℃의 온도에서 수행된다. 선택적으로, 상기 방법은, 20℃ 내지 45℃의 온도에서 수행될 수 있다. 좀 더 바람직하게는, 30℃ 내지 45℃의 온도에서 수행된다. 더욱 바람직하게는, 37℃ 내지 45℃의 온도에서 수행된다.
전술된 표적 핵산을 변형시키는 방법 중 어느 하나에서, 세포는 원핵세포일 수 있거나, 또는 선택적으로, 진핵세포일 수 있다.
숙주 세포 (Host Cells)
유리하게는, 본 발명은 광범위한 적용성이 있고, 본 발명의 숙주 세포는, 배양될 수 있는 임의의 유전적으로 다루기 쉬운 유기체로부터 유래될 수 있다. 따라서, 본 발명은 전술된 바와 같은 방법에 의해 형질전환된 숙주 세포를 제공한다. 본 발명은 이중 가닥 표적 폴리뉴클레오티드에서 표적 핵산 서열을 갖는 형질전환된 세포를 제공하며, 상기 세포는 여기에 제공된 바와 같은 Cas 단백질 또는 폴리펩티드 및 여기에 제공된 바와 같은 적어도 하나의 표적화 RNA 분자를 포함하고, 및 발현 벡터는 상기 Cas 단백질 및 상기 표적화 RNA 분자 중 적어도 하나를 인코딩하는 핵산을 포함한다.
적절한 숙주 세포는 원핵세포 또는 진핵세포일 수 있다. 특히, 흔히 사용되는 숙주 세포는, 유전적으로 접근하기 쉽고, 배양될 수 있는 원핵세포 또는 진핵세포, 예를 들어, 원핵세포, 곰팡이 세포, 식물 세포 및 동물 세포를 포함하는 본 발명에 따른 사용을 위해 선택될 수 있다. 바람직하게는, 숙주 세포는 원핵세포, 곰팡이 세포, 식물 세포, 원생 세포 또는 동물 세포로부터 선택될 것이다. 바람직하게는, 숙주 세포는, 원핵 세포, 곰팡이 세포, 식물 세포, 원생 세포 또는 인간 세포를 제외한 동물 세포로부터 선택될 것이다. 바람직하게는, 숙주 세포는 배아 줄기 세포를 포함하는, 인간 세포를 포함하지 않을 것이다. 높은 성장 속도를 통상적으로 나타내는 종으로부터 흔히 유래되는 본 발명에 따른 사용에 바람직한 숙주 세포는, 쉬게 배양 및/또는 형질전환되고, 짧은 세대 시간을 나타내며, 그들과 관련된 확립된 유전자원 (genetic resources)을 갖는 종들 또는 특정 조건하에서 이종 단백질의 최적 발현을 위해 선택, 변형 또는 합성되는 종들이다. 관심의 단백질이 궁극적으로 특정 산업적, 농업적, 화학적 또는 치료적 환경에 사용되는 본 발명의 바람직한 구체 예에서, 적절한 숙주 세포는, 관심의 단백질이 효율적으로 활용되는 원하는 특별한 조건 또는 세포내 환경에 기초하여 선택될 수 있다. 바람직하게는, 숙주 세포는 원핵세포일 것이다. 바람직한 구체 예에서, 숙주 세포는 박테리아 세포이다. 숙주 세포는, 예를 들어, 대장균 (E. coli) 세포일 수 있다. 바람직하게는, 상기 숙주 세포는 호열성 박테리아의 세포일 것이다.
여기에 기재된 본 발명의 방법 및 사용은 박테리아 세포의 게놈을 변형시키는데 사용될 수 있다. 특별한 구체 예에서, 상기 박테리아는 호열성 박테리아, 바람직하게는: Acidithiobacillus caldus 를 포함하는 Acidithiobacillus 종 (species); Aeribacillus pallidus를 포함하는 Aeribacillus 종; Alicyclobacillus acidocaldarius, Alicyclobacillus acidoterrestris, Alicyclobacillus cycloheptanicusI, Alicyclobacillus hesperidum를 포함하는 Alicyclobacillus 종; Anoxybacillus caldiproteolyticus, Anoxybacilus flavithermus, Anoxybacillus rupiensis, Anoxybacillus tepidamans를 포함하는 Anoxybacillus 종; Bacillus caldolyticus , Bacillus caldotenax , Bacillus caldovelox , Bacillus coagulans , Bacillus clausii , Bacillus hisashii, Bacillus licheniformis , Bacillus methanolicus , 바실러스 스미시이 ET138 를 포함하는 바실러스 스미시이, Bacillus subtilis , Bacillus thermocopriae, Bacillus thermolactis, Bacillus thermoamylovorans , Bacillus thermoleovorans를 포함하는 Bacillus 종; Caldibacillus debilis를 포함하는 Caldibacillus 종; Caldicellulosiruptor bescii , Caldicellulosiruptor hydrothermalis , Caldicellulosiruptor kristjanssonii, Caldicellulosiruptor kronotskyensis, Caldicellulosiruptor lactoaceticus, Caldicellulosiruptor obsidiansis, Caldicellulosiruptor owensensis, Caldicellulosiruptor saccharolyticus를 포함하는 Caldicellulosiruptor 종; Clostridium clariflavum, Clostridium straminisolvens, Clostridium tepidiprofundi, Clostridium thermobutyricum, Clostridium thermocellum, Clostridium thermosuccinogenes, Clostridium thermopalmarium를 포함하는 Clostridium 종; Deinococcus cellulosilyticus , Deinococcus deserti , Deinococcus geothermalis , Deinococcus murrayi , Deinococcus radiodurans 를 포함하는 Deinococcus 종; Defluviitalea phaphyphila를 포함하는 Defluviitalea 종; Desulfotomaculum carboxydivorans, Desulfotomaculum nigrificans, Desulfotomaculum salinum, Desulfotomaculum solfataricum를 포함하는 Desulfotomaculum 종; Desulfurella acetivorans를 포함하는 Desulfurella 종; Desulfurobacterium thermolithotrophum를 포함하는 Desulfurobacterium 종; Geobacillus icigianus, Geobacillus caldoxylosilyticus, Geobacillus jurassicus, Geobacillus galactosidasius, Geobacillus kaustophilus, Geobacillus lituanicus, Geobacillus stearothermophilus, Geobacillus subterraneus, Geobacillus thermantarcticus, Geobacillus thermocatenulatus, 지오바실러스 써모데니트리피칸스 , 지오바실러스 써모데니트리피칸스, Geobacillus thermoleovorans, Geobacillus toebii, Geobacillus uzenensis, Geobacillus vulcanii, Geobacillus zalihae를 포함하는 지오바실러스 종; Hydrogenobacter thermophiles를 포함하는 Hydrogenobacter 종; Hydrogenobaculum acidophilum를 포함하는 Hydrogenobaculum 종; Ignavibacterium album를 포함하는 Ignavibacterium 종; Lactobacillus bulgaricus , Lactobacillus delbrueckii , Lactobacillus ingluviei, Lactobacillus thermotolerans 를 포함하는 Lactobacillus 종; Marinithermus hydrothermalis를 포함하는 Marinithermus 종; Moorella thermoacetica 를 포함하는 Moorella 종; Oceanithermus desulfurans, Oceanithermus profundus를 포함하는 Oceanithermus 종; Paenibacillus sp. J2, Paenibacillus marinum, Paenibacillus thermoaerophilus를 포함하는 Paenibacillus 종; Persephonella guaymasensis, Persephonella hydrogeniphila, Persephonella marina를 포함하는 Persephonella 종; Rhodothermus marinus , Rhodothermus obamensis, Rhodothermus profundi를 포함하는 Rhodothermus 종; Sulfobacillus acidophilus를 포함하는 Sulfobacillus 종; Sulfurihydrogenibium azorense, Sulfurihydrogenibium kristjanssonii, Sulfurihydrogenibium rodmanii, Sulfurihydrogenibium yellowstonense를 포함하는 Sulfurihydrogenibium 종; Symbiobacterium thermophilum, Symbiobacterium toebii를 포함하는 Symbiobacterium 종; Thermoanaerobacter brockii , Thermoanaerobacter ethanolicus , Thermoanaerobacter italicus, Thermoanaerobacter kivui, Thermoanaerobacter marianensis, Thermoanaerobacter mathranii, Thermoanaerobacter pseudoethanolicus, Thermoanaerobacter wiegelii를 포함하는 Thermoanaerobacter 종; Thermoanaerobacterium aciditolerans, Thermoanaerobacterium aotearoense, Thermoanaerobacterium ethanolicus, Thermoanaerobacterium pseudoethanolicus , Thermoanaerobacterium saccharolyticum , Thermoanaerobacterium thermosaccharolyticum , Thermoanaerobacterium xylanolyticum 를 포함하는 Thermoanaerobacterium 종; Thermobacillus composti, Thermobacillus xylanilyticus를 포함하는 Thermobacillus 종; Thermocrinis albus, Thermocrinis ruber를 포함하는 Thermocrinis 종; Thermodesulfatator atlanticus, Thermodesulfatator autotrophicus, Thermodesulfatator indicus를 포함하는 Thermodulfatator 종; Thermodesulfobacterium commune, Thermodesulfobacterium hydrogeniphilum를 포함하는 Thermodesulfobacterium 종; Thermodesulfobium narugense를 포함하는 Thermodesulfobium 종; Thermodesulfovibrio aggregans, Thermodesulfovibrio thiophilus, Thermodesulfovibrio yellowstonii를 포함하는 Thermodesulfovibrio 종; Thermosipho africanus, Thermosipho atlanticus, Thermosipho melanesiensis를 포함하는 Thermosipho 종; Thermotoga maritima , Thermotoga neopolitana, Thermotoga sp. RQ7를 포함하는 Thermotoga 종; Thermovibrio ammonificans, Thermovibrio ruber를 포함하는 Thermovibrio 종; Thermovirga lienii and Thermus species including Thermus aquaticus , Thermus caldophilus , Thermus flavus , Thermus scotoductus , Thermus thermophilus 를 포함하는 Thermovirga 종; Thiobacillus neapolitanus로부터 선택된다.
또 다른 관점에서, 여기서 기재된 방법 또는 사용은 중온성인 박테리아를 변형시키는데 사용될 수 있다. 바람직한 구체 예에서, 박테리아는: Acidithiobacillus caldus 를 포함하는 Acidithiobacillus 종; Actinobacillus succinogenes 를 포함하는 Actinobacillus 종; Anaerobiospirillum succiniciproducens를 포함하는 Anaerobiospirillum 종; Bacillus alcaliphilus , Bacillus amyloliquefaciens , Bacillus circulans, Bacillus cereus , Bacillus clausii , Bacillus firmus, Bacillus halodurans, Bacillus hisashii, Bacillus lautus, Bacillus lentus, Bacillus licheniformis , Bacillus megaterium , Bacillus pumilus, Bacillus smithii, Bacillus subtilis , Bacillus thuringiensis 를 포함하는 Bacillus 종; Basfia succiniciproducens 를 포함하는 Basfia 종; Brevibacillus brevis 를 포함하는 Brevibacillus 종; Brevibacillus laterosporus ; Clostridium acetobutylicum, Clostridium autoethanogenum , Clostridium beijerinkii , Clostridium carboxidivorans, Clostridium cellulolyticum , Clostridium ljungdahlii , Clostridium pasteurianum , Clostridum perfringens , Clostridium ragsdalei, Clostridium saccharobutylicum, Clostridium saccharoperbutylacetonium를 포함하는 Clostridium 종; Corynebacterium glutamicum 를 포함하는 Corynebacterium 종; Desulfitobacterium dehalogenans , Desulfitobacterium hafniense를 포함하는 Desulfitobacterium 종; Desulfotomaculum acetoxidans, Desulfotomaculum gibsoniae, Desulfotomaculum reducens, Desulfotomaculum ruminis를 포함하는 Desulfotomaculum 종; Enterobacter asburiae를 포함하는 Enterobacter 종; Enterococcus faecalis 를 포함하는 Enterococcus 종; Escherichia coli 를 포함하는 Escherichia 종; Lactobacillus acidophilus , Lactobacillus amylophilus , Lactobacillus amylovorus , Lactobacillus animalis, Lactobacillus arizonensis, Lactobacillus bavaricus , Lactobacillus brevis , Lactobacillus buchneri , Lactobacillus bulgaricus , Lactobacillus casei , Lactobacillus corynoformis, Lactobacillus crispatus , Lactobacillus curvatus , Lactobacillus delbrueckii , Lactobacillus fermentum , Lactobacillus gasseri , Lactobacillus helveticus , Lactobacillus johnsonii , Lactobacillus pentosus , Lactobacillus plantarum , Lactobacillus reuteri , Lactobacillus rhamnosus , Lactobacillus sakei , Lactobacillus salivarius , Lactobacillus sanfriscensis 를 포함하는 Lactobacillus 종; Lactococcus lactis 를 포함하는, Lactococcus 종; Mannheimia succiniciproducens 를 포함하는 Mannheimia 종; Paenibacillus alvei , Paenibacillus beijingensis, Paenibacillus borealis, Paenibacillus dauci, Paenibacillus durus, Paenibacillus graminis, Paenibacillus larvae , Paenibacillus lentimorbus, Paenibacillus macerans, Paenibacillus mucilaginosus, Paenibacillus odorifer, Paenibacillus polymyxa , Paenibacillus stellifer, Paenibacillus terrae, Paenibacillus wulumuqiensis를 포함하는 Paenibacillus 종; Pediococcus acidilactici , Pediococcus claussenii, Pediococcus ethanolidurans, Pediococcus pentosaceus 를 포함하는 Pediococcus 종; P. acidipropionici , P. freudenreichii , P. jensenii 를 포함하는 Propionibacterium 종; Salmonella typhimurium; Sporolactobacillus inulinus, Sporolactobacillus laevolacticus를 포함하는 Sporolactobacillus 종; Staphylococcus aureus; Streptococcus agalactiae , Streptococcus bovis , Streptococcus equisimilis, Streptococcus feacalis, Streptococcus mutans, Streptococcus oralis, Streptococcus pneumonia, Streptococcus pyogenes, Streptococcus salivarius, Streptococcus thermophilus , Streptococcus sobrinus, Streptococcus uberis를 포함하는 Streptococcus 종; Streptomyces achromogenes, Streptomyces avermitilis, Streptomyces coelicolor , Streptomyces griseus, Streptomyces lividans , Streptomyces parvulus , Streptomyces venezuelae, Streptomyces vinaceus 를 포함하는 Streptomyces 종; Tetragenococcus halophilus 를 포함하는 Tetragenococcus 종 및 Zymomonas mobilis 를 포함하는 Zymomonas 종; 슈도모나스 퓨티다, Pseudomonas aeruginosa, Pseudomonas alcaligenes, Pseudomonas anguilliseptica, Pseudomonas argentinensis, Pseudomonas borbori, Pseudomonas citronellolis, Pseudomonas flavescens, Pseudomonas mendocina, Pseudomonas nitroreducens, Pseudomonas oleovorans, Pseudomonas pseudoalcaligenes, Pseudomonas resinovorans, Pseudomonas straminea, Pseudomonas asplenii, Pseudomonas aurantiaca, Pseudomonas aureofaciens, Pseudomonas chlororaphis, Pseudomonas corrugate, Pseudomonas fragi, Pseudomonas lundensis, Pseudomonas taetrolens, Pseudomonas antarctica, Pseudomonas azotoformans, 'Pseudomonas blatchfordae', Pseudomonas brassicacearum, Pseudomonas brenneri, Pseudomonas cedrina, Pseudomonas corrugate, Pseudomonas fluorescens, Pseudomonas gessardii, Pseudomonas libanensis, Pseudomonas mandelii, Pseudomonas marginalis, Pseudomonas mediterranea, Pseudomonas meridiana, Pseudomonas migulae, Pseudomonas mucidolens, Pseudomonas orientalis, Pseudomonas panacis, Pseudomonas protegens, Pseudomonas proteolytica, Pseudomonas rhodesiae, Pseudomonas synxantha, Pseudomonas thivervalensis, Pseudomonas tolaasii, Pseudomonas veronii, Pseudomonas denitrificans, Pseudomonas pertucinogena, Pseudomonas cremoricolorata, Pseudomonas entomophila, Pseudomonas fulva, Pseudomonas monteilii, Pseudomonas mosselii, Pseudomonas oryzihabitans, Pseudomonas parafulva, Pseudomonas plecoglossicida, 슈도모나스 퓨티다, Pseudomonas balearica, Pseudomonas luteola, Pseudomonas stutzeri, Pseudomonas amygdali, Pseudomonas avellanae, Pseudomonas caricapapayae, Pseudomonas cichorii, Pseudomonas coronafaciens, Pseudomonas ficuserectae, 'Pseudomonas helianthi', Pseudomonas meliae, Pseudomonas savastanoi, Pseudomonas syringae, 'Pseudomonas tomato', Pseudomonas viridiflava, Pseudomonas abietaniphila, Pseudomonas acidophila, Pseudomonas agarici, Pseudomonas alcaliphila, Pseudomonas alkanolytica, Pseudomonas amyloderamosa, Pseudomonas asplenii, Pseudomonas azotifigens, Pseudomonas cannabina, Pseudomonas coenobios, Pseudomonas congelans, Pseudomonas costantinii, Pseudomonas cruciviae, Pseudomonas delhiensis, Pseudomonas excibis, Pseudomonas extremorientalis, Pseudomonas frederiksbergensis, Pseudomonas fuscovaginae, Pseudomonas gelidicola, Pseudomonas grimontii, Pseudomonas indica, Pseudomonas jessenii, Pseudomonas jinjuensis, Pseudomonas kilonensis, Pseudomonas knackmussii, Pseudomonas koreensis, Pseudomonas lini, Pseudomonas lutea, Pseudomonas moraviensis, Pseudomonas otitidis, Pseudomonas pachastrellae, Pseudomonas palleroniana, Pseudomonas papaveris, Pseudomonas peli, Pseudomonas perolens, Pseudomonas poae, Pseudomonas pohangensis, Pseudomonas protegens, Pseudomonas psychrophila, Pseudomonas psychrotolerans, Pseudomonas rathonis, Pseudomonas reptilivora, Pseudomonas resiniphila, Pseudomonas rhizosphaerae, Pseudomonas rubescens, Pseudomonas salomonii, Pseudomonas segitis, Pseudomonas septica, Pseudomonas simiae, Pseudomonas suis, Pseudomonas thermotolerans, Pseudomonas toyotomiensis, Pseudomonas tremae, Pseudomonas trivialis, Pseudomonas turbinellae, Pseudomonas tuticorinensis, Pseudomonas umsongensis, Pseudomonas vancouverensis, Pseudomonas vranovensis, Pseudomonas xanthomarina를 포함하는 Pseudomonas 종으로부터 선택된다. 바람직하게는 mesophilic bacterium는 슈도모나스 퓨티다이다.
또 다른 관점에서, 여기에 정의된 방법 또는 사용은 효모 또는 곰팡이의 게놈을 변형시키는데 사용될 수 있다. 특정 구체 예에서, 곰팡이 종은 중온성이고, 바람직하게는, 곰팡이는: Aspergillus nidulans , Aspergillus niger , Aspergillus oryzae and Aspergillus terreus를 포함하지만, 이에 제한되지 않는, Aspegillus 종으로부터 선택되고, 더욱 바람직하게는, Aspergillus 종은 Aspergillus nidulans 또는 Aspergillus niger이다. 선택적으로, 상기 중온성 곰팡이 종은 Candida 종일 수 있다. 여기서 정의된 방법 또는 사용은, Saccharomyces cerevisiae 를 포함하는 Saccharomyces 종, Schizosaccharomyces pombe 을 포함하는 Schizosaccharomyces 종, Schizosaccharomyces pombe 을 포함하는 Schizosaccharomyces 종, Pichia pastoris , Pichia stipitis 를 포함하지만, 이에 제한되지 않는 Pichia 종을 포함하지만, 이에 제한되지 않는, 효모 종의 게놈을 변형시키는데 사용될 수 있다. 여기서 정의된 방법 또는 사용은, Hansenula polymorpha 를 포함하는 Hansenula 종, P. brasilianum , P. chrysogenum 를 포함하지만, 이에 제한되지 않는 Penicillium 종, Yarrowia lipolytica 를 포함하는 Yarrowia 종을 포함하지만, 이에 제한되지 않는, 곰팡이 종의 게놈을 변형시키는데 사용될 수 있다.
본 발명은, 호열성인 효모 또는 곰팡이 종을 변형시키는데 여기서 정의된 바와 같은 사용 방법과 더욱 관련되고, 바람직하게는, 곰팡이 또는 효모는: Aspergillus fumigatus , Aspergillus nidulans , Aspergillus terreus, Aspergillus versicolor를 포함하는 Aspergillus 종; Canariomyces thermophile를 포함하는 Canariomyces 종; Chaetomium mesopotamicum, Chaetomium thermophilum 를 포함하는 Chaetomium 종; Candida bovina, Candida sloofii, Candida thermophila, Candida tropicalis , Candida krusei (=Issatchenkia orientalis)를 포함하는 Candida 종; Cercophora coronate, Cercophora septentrionalis를 포함하는 Cercophora 종; Coonemeria aegyptiaca를 포함하는 Coonemeria 종; Corynascus thermophiles를 포함하는 Corynascus 종; Geotrichum candidum를 포함하는 Geotrichum 종; Kluyveromyces fragilis , Kluyveromyces marxianus 를 포함하는 Kluyveromyces 종; Malbrnchea cinnamomea, Malbranchea sulfurea를 포함하는 Malbranchea 종; Melanocarpus albomyces를 포함하는 Melanocarpus 종; Myceliophthora fergusii, Myceliophthora thermophila를 포함하는 Myceliophtora 종; Mycothermus thermophiles (=Scytalidium thermophilum/Torula thermophila)를 포함하는 Mycothermus 종; Myriococcum thermophilum를 포함하는 Myriococcum 종; Paecilomyces thermophila를 포함하는 Paecilomyces 종; Remersonia thermophila를 포함하는 Remersonia 종; Rhizomucor pusillus, Rhizomucor tauricus 를 포함하는 Rhizomucor 종; Saccharomyces cerevisiae 를 포함하는 Saccharomyces 종; Schizosaccharomyces pombe 를 포함하는 Schizosaccharomyces 종; Scytalidium thermophilum를 포함하는 Scytalidium 종; Sordaria thermophila를 포함하는 Sordaris 종; Thermoascus aurantiacus, Thermoascus thermophiles를 포함하는 Thermoascus 종; Thermomucor indicae-seudaticae를 포함하는 Thermomucor 종; 및 Thermomyces ibadanensis, Thermomyces lanuginosus 를 포함하는 Thermomyces 종으로부터 선택된다.
전술된 목록에서, 굵은 활자체로 식별된 미생물은 본 발명에 사용하기에 특히 적절한/적용가능한 것으로 밝혀졌다.
본 발명의 몇몇 바람직한 구체 예는: Aeribacillus, Alicyclobacillus, Anoxybacillus, Bacillus, Geobacillus를 포함하는 호열성 바실러스; Paenibacillus 종; Anaerobacterium, Caldicellulosiruptor, Clostridium, Moorella, Thermoanaerobacter, Thermoanaerobacterium, Thermobrachium, Thermohalobacter 종 또는 하나 이상의 호열성 락토바실러스 종을 포함하는 호열성 clostridia로부터 선택된 하나 이상의 호열성 미생물 및 및 Bacillus 종, Escherichia coli, Lactobacillus 종, Lactococcus 종, Propionibacterium 종 및 Pseudomonas 종으로부터 선택된 중온성 박테리아를 포함한다.
이하는 본 발명에 따라 사용된 Cas 단백질의 폴리뉴클레오티드 및 아미노산 서열이다.
[SEQ ID NO: 1] 지오바실러스 써모데니트리피칸스 T12 Cas9 단백질 AA 서열
MKYKIGLDIGITSIGWAVINLDIPRIEDLGVRIFDRAENPKTGESLALPRRLARSARRRLRRRKHRLERIRRLFVREGILTKEELNKLFEKKHEIDVWQLRVEALDRKLNNDELARILLHLAKRRGFRSNRKSERTNKENSTMLKHIEENQSILSSYRTVAEMVVKDPKFSLHKRNKEDNYTNTVARDDLEREIKLIFAKQREYGNIVCTEAFEHEYISIWASQRPFASKDDIEKKVGFCTFEPKEKRAPKATYTFQSFTVWEHINKLRLVSPGGIRALTDDERRLIYKQAFHKNKITFHDVRTLLNLPDDTRFKGLLYDRNTTLKENEKVRFLELGAYHKIRKAIDSVYGKGAAKSFRPIDFDTFGYALTMFKDDTDIRSYLRNEYEQNGKRMENLADKVYDEELIEELLNLSFSKFGHLSLKALRNILPYMEQGEVYSTACERAGYTFTGPKKKQKTVLLPNIPPIANPVVMRALTQARKVVNAIIKKYGSPVSIHIELARELSQSFDERRKMQKEQEGNRKKNETAIRQLVEYGLTLNPTGLDIVKFKLWSEQNGKCAYSLQPIEIERLLEPGYTEVDHVIPYSRSLDDSYTNKVLVLTKENREKGNRTPAEYLGLGSERWQQFETFVLTNKQFSKKKRDRLLRLHYDENEENEFKNRNLNDTRYISRFLANFIREHLKFADSDDKQKVYTVNGRITAHLRSRWNFNKNREESNLHHAVDAAIVACTTPSDIARVTAFYQRREQNKELSKKTDPQFPQPWPHFADELQARLSKNPKESIKALNLGNYDNEKLESLQPVFVSRMPKRSITGAAHQETLRRYIGIDERSGKIQTVVKKKLSEIQLDKTGHFPMYGKESDPRTYEAIRQRLLEHNNDPKKAFQEPLYKPKKNGELGPIIRTIKIIDTTNQVIPLNDGKTVAYNSNIVRVDVFEKDGKYYCVPIYTIDMMKGILPNKAIEPNKPYSEWKEMTEDYTFRFSLYPNDLIRIEFPREKTIKTAVGEEIKIKDLFAYYQTIDSSNGGLSLVSHDNNFSLRSIGSRTLKRFEKYQVDVLGNIYKVRGEKRVGVASSSHSKAGETIRPL*
[SEQ ID NO: 7] 지오바실러스 써모데니트리피칸스 T12 Cas9 DNA 서열
ATGAAGTATAAAATCGGTCTTGATATCGGCATTACGTCTATCGGTTGGGCTGTCATTAATTTGGACATTCCTCGCATCGAAGATTTAGGTGTCCGCATTTTTGACAGAGCGGAAAACCCGAAAACCGGGGAGTCACTAGCTCTTCCACGTCGCCTCGCCCGCTCCGCCCGACGTCGTCTGCGGCGTCGCAAACATCGACTGGAGCGCATTCGCCGCCTGTTCGTCCGCGAAGGAATTTTAACGAAGGAAGAGCTGAACAAGCTGTTTGAAAAAAAGCACGAAATCGACGTCTGGCAGCTTCGTGTTGAAGCACTGGATCGAAAACTAAATAACGATGAATTAGCCCGCATCCTTCTTCATCTGGCTAAACGGCGTGGATTTAGATCCAACCGCAAGAGTGAGCGCACCAACAAAGAAAACAGTACGATGCTCAAACATATTGAAGAAAACCAATCCATTCTTTCAAGTTACCGAACGGTTGCAGAAATGGTTGTCAAGGATCCGAAATTTTCCCTGCACAAGCGTAATAAAGAGGATAATTACACCAACACTGTTGCCCGCGACGATCTTGAACGGGAAATCAAACTGATTTTCGCCAAACAGCGCGAATATGGGAACATCGTTTGCACAGAAGCATTTGAACACGAGTATATTTCCATTTGGGCATCGCAACGCCCTTTTGCTTCTAAGGATGATATCGAGAAAAAAGTCGGTTTCTGTACGTTTGAGCCTAAAGAAAAACGCGCGCCAAAAGCAACATACACATTCCAGTCCTTCACCGTCTGGGAACATATTAACAAACTTCGTCTTGTCTCCCCGGGAGGCATCCGGGCACTAACCGATGATGAACGTCGTCTTATATACAAGCAAGCATTTCATAAAAATAAAATCACCTTCCATGATGTTCGAACATTGCTTAACTTGCCTGACGACACCCGTTTTAAAGGTCTTTTATATGACCGAAACACCACGCTGAAGGAAAATGAGAAAGTTCGCTTCCTTGAACTCGGCGCCTATCATAAAATACGGAAAGCGATCGACAGCGTCTATGGCAAAGGAGCAGCAAAATCATTTCGTCCGATTGATTTTGATACATTTGGCTACGCATTAACGATGTTTAAAGACGACACCGACATTCGCAGTTACTTGCGAAACGAATACGAACAAAATGGAAAACGAATGGAAAATCTAGCGGATAAAGTCTATGATGAAGAATTGATTGAAGAACTTTTAAACTTATCGTTTTCTAAGTTTGGTCATCTATCCCTTAAAGCGCTTCGCAACATCCTTCCATATATGGAACAAGGCGAAGTCTACTCAACCGCTTGTGAACGAGCAGGATATACATTTACAGGGCCAAAGAAAAAACAGAAAACGGTATTGCTGCCGAACATTCCGCCGATCGCCAATCCGGTCGTCATGCGCGCACTGACACAGGCACGCAAAGTGGTCAATGCCATTATCAAAAAGTACGGCTCACCGGTCTCCATCCATATCGAACTGGCCCGGGAACTATCACAATCCTTTGATGAACGACGTAAAATGCAGAAAGAACAGGAAGGAAACCGAAAGAAAAACGAAACTGCCATTCGCCAACTTGTTGAATATGGGCTGACGCTCAATCCAACTGGGCTTGACATTGTGAAATTCAAACTATGGAGCGAACAAAACGGAAAATGTGCCTATTCACTCCAACCGATCGAAATCGAGCGGTTGCTCGAACCAGGCTATACAGAAGTCGACCATGTGATTCCATACAGCCGAAGCTTGGACGATAGCTATACCAATAAAGTTCTTGTGTTGACAAAGGAGAACCGTGAAAAAGGAAACCGCACCCCAGCTGAATATTTAGGATTAGGCTCAGAACGTTGGCAACAGTTCGAGACGTTTGTCTTGACAAATAAGCAGTTTTCGAAAAAGAAGCGGGATCGACTCCTTCGGCTTCATTACGATGAAAACGAAGAAAATGAGTTTAAAAATCGTAATCTAAATGATACCCGTTATATCTCACGCTTCTTGGCTAACTTTATTCGCGAACATCTCAAATTCGCCGACAGCGATGACAAACAAAAAGTATACACGGTCAACGGCCGTATTACCGCCCATTTACGCAGCCGTTGGAATTTTAACAAAAACCGGGAAGAATCGAATTTGCATCATGCCGTCGATGCTGCCATCGTCGCCTGCACAACGCCGAGCGATATCGCCCGAGTCACCGCCTTCTATCAACGGCGCGAACAAAACAAAGAACTGTCCAAAAAGACGGATCCGCAGTTTCCGCAGCCTTGGCCGCACTTTGCTGATGAACTGCAGGCGCGTTTATCAAAAAATCCAAAGGAGAGTATAAAAGCTCTCAATCTTGGAAATTATGATAACGAGAAACTCGAATCGTTGCAGCCGGTTTTTGTCTCCCGAATGCCGAAGCGGAGCATAACAGGAGCGGCTCATCAAGAAACATTGCGGCGTTATATCGGCATCGACGAACGGAGCGGAAAAATACAGACGGTCGTCAAAAAGAAACTATCCGAGATCCAACTGGATAAAACAGGTCATTTCCCAATGTACGGGAAAGAAAGCGATCCAAGGACATATGAAGCCATTCGCCAACGGTTGCTTGAACATAACAATGACCCAAAAAAGGCGTTTCAAGAGCCTCTGTATAAACCGAAGAAGAACGGAGAACTAGGTCCTATCATCCGAACAATCAAAATCATCGATACGACAAATCAAGTTATTCCGCTCAACGATGGCAAAACAGTCGCCTACAACAGCAACATCGTGCGGGTCGACGTCTTTGAGAAAGATGGCAAATATTATTGTGTCCCTATCTATACAATAGATATGATGAAAGGGATCTTGCCAAACAAGGCGATCGAGCCGAACAAACCGTACTCTGAGTGGAAGGAAATGACGGAGGACTATACATTCCGATTCAGTCTATACCCAAATGATCTTATCCGTATCGAATTTCCCCGAGAAAAAACAATAAAGACTGCTGTGGGGGAAGAAATCAAAATTAAGGATCTGTTCGCCTATTATCAAACCATCGACTCCTCCAATGGAGGGTTAAGTTTGGTTAGCCATGATAACAACTTTTCGCTCCGCAGCATCGGTTCAAGAACCCTCAAACGATTCGAGAAATACCAAGTAGATGTGCTAGGCAACATCTACAAAGTGAGAGGGGAAAAGAGAGTTGGGGTGGCGTCATCTTCTCATTCGAAAGCCGGGGAAACTATCCGTCCGTTATAA
실시 예 1: 지오바실러스 써모데니트리피칸스의 단리
G. 써모데니트리피칸스는, 놀랍게도 혐기성 조건하에서 리그노셀룰로스 기질 (lignocellulosic substrates)을 분해할 수 있는 호열균에 대한 ±500 단리균 (isolates)의 라이브러리의 검색 동안에 발견되었다. 처음에, ±500 단리균의 라이브러리는 확립되고, 셀룰로오스 및 크실란 상에 단리에 의한 여러 차례의 선택 라운드 후에 110 단리균까지 줄인다. 110 단리균의 라이브러리는, 라이브러리의 79%를 나타내는 G. 써모데니트리피칸스로, 지오바실러스 단리균 만으로 이루어진다.
단리된 G. 써모데니트리피칸스 균주는 "T12"로 명명된다. G. 써모데니트리피칸스 T12 유래의 Cas9 단백질은 "gtCas9"로 명명된다.
실시 예 2: 지오바실러스 써모데니트리피칸스에서 Cas9에 대한 필수적인 공통 서열 (consensus sequences)을 정의
다음의 데이터베이스 검색 및 정렬은 수행된다:
pBLAST 및 nBLAST는 G. 써모데니트리피칸스 T12의 단백질 또는 유전자 서열이 질의 서열 (query sequence)로서 사용되는, 사내의 BLAST 서버상에서 수행된다. 이 데이터베이스는 2014년 5월에 최종 업데이트되었으며, 따라서 가장 최근에 추가된 지오바실러스 게놈을 함유하지 않지만, 보통 온라인 BLAST는 T12 서열의 공개를 방지하는데 사용되지 않았다. BLAST 검색에서 40%를 초과하는 것으로 동정된 서열 동일성은 도 1에 포함된다.
더 최근의 서열 데이터를 포함하기 위해, (gtCas9에 가장 밀접하게 관련된) 지오바실러스 MAS1의 서열은, NCBI 웹사이트 상에서 PSI-BLAST를 수행하는데 사용된다 (Johnson et al., 2008 Nucleic Acids Res. 36(Web Server issue): W5-9). 2 연속 라운드의 PSI-BLAST는 수행되며, 여기서, 하기의 기준에 부합하는 서열만이 다음 라운드에 사용된다: 제1 라운드에서 96% 및 제2 및 제3 라운드에서 97%의 최소 서열 커버리지, 최소 동일성 40%, 종에 대하여 오직 하나의 가닥.
PSI-BLAST로부터 결과하는 서열뿐만 아니라, PSI-BLAST에 나타나지 않은 내부 서버 pBLAST로부터 T12와 40% 초과의 동일성을 갖는 서열은, 현재 잘-특징화된 중온성 서열 및 현재 동정된 모든 호열성 서열도, 이들이 더 먼 관계인 경우와 함께, 정열되며, 이로부터 근린-결합 트리는 구성된다 (도 1 참조). 정렬은 ClustalW를 사용하여 Mega6에서 수행되고, 그 이후 트리는 근린-결합 방법을 사용하여 구축되며, 부트스트랩 분석 (bootstrap analysis)은 1000 반복수 (replicates)를 사용하여 수행된다.
BLASTn이 질의 서열로서 지오바실러스 속 MAS1을 사용하여 수행된 경우, 오직 지오바실러스 속 JF8 Cas9는 88%의 동일성으로 동정되어, 유전자 수준에서 매우 적은 상동성을 나타낸다. 도 2는 클러스탈-정렬된 (Clustal-aligned) Cas9 유전자 서열의 근린-결합 트리이다.
G. 써모데니트리피칸스 T12, A. naeslundii 및 S. pyogenes의 단백질 서열은, BLOSUM62를 기본 설정 (default settings)으로 사용하여 CloneManager에서 이들을 정렬하여 단백질 도메인 상동성을 위해 더욱 분석된다 (도 3 참조).
실시 예 3: CAS9의 기능에 필수적인 코어 아미노산 모티프 및 호열성 Cas9 뉴클레아제에서 열안정성을 부여하는 아미노산 모티프의 동정
전술된 정렬된 단백질 서열의 퍼센트 동일성은 도 1에 제공된다. gtCas9는 타입 Ⅱ-C에 속한다. 타입 Ⅱ-C 시스템의 가장 자주-연구되고, 최근에 결정화된 구조는, Actinomyces naeslundii에서 유래된다 (Jinek et al., 2014, Science 343: 1247997). 이 단백질 서열은 gtCas9에 대해 단지 20%의 동일성을 나타내지만, 고도로 보존된 잔기 (conserved residues)를 추정하는데 사용될 수 있다. 2개의 잘-특징화된 타입 Ⅱ-A 시스템 (S. pyogenes 및 S. thermophilus)은 또한 분석에 포함된다 (Jinek et al., 2014, Science 343: 1247997; Nishimasu et al., 2014, Cell 156: 935-949). 이들 4개의 단백질 서열의 정렬은, 도 3에 나타내고; 도 4는 A. naeslundii ('Ana-Cas9')에 대해 결정된 바와 같은 단백질 아키텍쳐 (protein architecture)를 나타낸다 (Jinek et al., 2014, Science 343: 1247997). t12 (gtCas9) 및 Actinomyces naeslundii 유래의 Cas9의 길이는, 매우 유사하고 (A. naeslundii 1101 aa, T12 1082 aa) 및 gtCas9는 유사한 단백질 아키텍쳐를 가질 것으로 예상되지만, cas9-Ana에 대한 전체 서열 동일성이 단지 20%이기 때문에, 이것은 아직 결정되지 않는다. A. naeslundii 및 S. pyogenes 유래의 Cas9에서 Jinek et al. (Jinek et al., 2014, Science 343: 1247997)에 의해 기재된 모든 활성 부위 잔기는 gtCas9에서 동정될 수 있다 (도 3 참조). PAM-결합 도메인은, S. pyogenes 타입 Ⅱ-A 시스템에 대해 결정되어 있지만, 임의의 타입 Ⅱ-C 시스템에 대해서는 결정되지 않고, 따라서 S. pyogenes 서열에서만 나타난다. 게다가, PAM-인식 부위는, CRISPR 시스템들 사이뿐만 아니라 동일한 시스템을 함유하는 종들 사이에서도, 강하게 변한다.
실시 예 4: G. 써모데니트리피칸스 gtCas9의 PAM 서열의 결정
원핵생물 CRISPR 시스템이 적응 면역 시스템으로서 이들의 숙주에 도움이 되고 (Jinek et al., 2012, Science 337: 816-821), 및 신속하고 효과적인 유전 공학을 위해 사용될 수 있는 것으로 확립되었다 (Mali et al., 2013, Nat Methods 10: 957-963.).
Cas9 단백질은 타입 Ⅱ CRISPR 시스템에 대한 서열-특이적 뉴클레아제로서 기능한다 (Makarova et al., 2011, Nat Rev Micro 9: 467-477). 반복 영역에 연결된 "스페이서" (표적)로 이루어진, 작은 crRNA 분자는, CRISPR 유전자좌의 전사 및 공정 산물 (processing products)이다. "스페이서"는 박테리오파지 및 유동적 유전 인자 (mobile genetic elements)의 게놈에서 자연적으로 기원하지만, 이들은 또한 유전 공학 공정 동안, 특이적 뉴클레오티드 서열을 표적으로 하도록 디자인될 수도 있다 (Bikard et al., 2013, Nucleic Acids Research 41: 7429-7437). crRNA 분자는 이들의 DNA 표적의 동정을 위한 가이드로서 Cas9에 의해 이용된다. 상기 스페이서 영역은 절단 DNA 영역에 대한 표적물인, "프로토스페이서"와 동일하다 (Brouns et al., 2012, Science 337: 808-809). 프로토스페이서 다음의, PAM (Protospacer Adjacent Motif)은, Cas9에 의한 표적의 인지를 위해 요구된다 (Jinek et al., 2012, Science 337: 816-821).
타입 Ⅱ 시스템에 대한 시험관 내 또는 생체 내 PAM-결정 연구를 수행하기 위해, 시스템의 CRISPR 어레이 (CRISPR array), tracrRNA-발현 모듈을 인실리코 예측하는 것은 필요하다. CRISPR 어레이는 crRNA 모듈의 동정을 위해 사용된다. tracrRNA-발현 서열은, 500 bp-윈도우 플랜킹 Cas9 (500 bp-window flanking Cas9) 내에 또는 Cas 유전자와 CRISPR 유전자좌 사이에 위치된다 (Chylinski, K., et al. (2014) Classification and evolution of type II CRISPR-Cas systems. Nucleic Acids Res. 42, 6091-6105). tracrRNA는 CRISPR 어레이의 직접 반복에 대한 높은 수준의 상보성을 갖는 5'-서열, 뒤이어 2개 이상의 스템-루프 구조 및 Rho-비의존 전사 종결 신호의 예측된 구조로 이루어져야 한다 (Ran, F.A., et al. (2015) In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191). crRNA 및 tracrRNA 분자는 그 다음 키메라 sgRNA 모듈을 디자인하는데 사용될 수 있다. sgRNA의 5'-말단은, CRISPR 어레이의 절단된 (truncated) 20nt 길이의 스페이서 뒤이어 16-20nt 길이의 절단된 반복으로 이루어진다. 이 반복은 상응하는 절단된 anti-반복 및 tracrRNA 모듈의 스템 루프가 뒤따른다. sgRNA의 반복 및 anti-반복 부분은, 일반적으로 GAAA 링커에 연결된다 (Karvelis, T., et al. (2015) Rapid characterization of CRISPR-Cas9 protospacer adjacent motif sequence elements. Genome Biol. 16, 253).
G. 써모데니트리피칸스 T12 타입 Ⅱc CRISPR 시스템의 cas 유전자들 (cas9 뒤이어 cas1 및 cas2 유전자)은, T12 염색체의 안티센스 가닥 (antisense strand)을 사용하여 전사된다. cas2 유전자는 100bp 길이의 DNA 단편이 뒤따르고, 전사시 다중 루프를 갖는 RNA 구조를 형성한다. 이 구조는 분명히 전사 종결인자 (transcriptional terminator)의 역할을 한다.
11개의 반복 및 10개의 스페이서 서열을 갖는 CRISPR 어레이는, 전사 종결 서열의 업스트림에 위치되며, 어레이의 리더는 어레이의 5' 말단에 위치된다. tracrRNA로 전사되는 DNA 유전자좌는, cas9 유전자의 다운스트림에 존재할 것으로 예상된다. CRISPR 어레이로부터 36bp 길이의 반복을 갖는 cas9 유전자의 다운스트림 우측에 325bp 길이의 서열의 정렬은 (도 6에 나타낸) 반복과 거의 동일한 tracrRNA 유전자좌에 36bp 길이의 서열이 있음이 밝혀졌다. 이 결과는 tracrRNA 유전자좌의 전사의 방향이 CRISPR 어레이의 전사의 방향과 반대이어야 한다는 결론을 이끌어냈다. 결과적으로, tracrRNA의 5'말단은 crRNA의 3'-말단에 상보적일 것이어서, -Cas9가 필요로 하는- 이중-RNA 분자의 형성으로 이어진다.
실시 예 5: 무작위화된 PAM을 갖는 표적 발생
G. 써모데니트리피칸스 T12 균주의 CRISPR Ⅱ 유전자좌로부터 2개의 다른 스페이서는, 주형 (template)으로서 G. 써모데니트리피칸스 T12 게놈 DNA를 사용하는 PCR에 의해 증폭된다. 2쌍의 축퇴 프라이머 (degenerate primers)는 각 스페이서의 증폭을 위해 사용된다:
먼저, "프로토스페이서" 단편의 업스트림에 6개의 무작위 뉴클레오티드의 도입을 일으키는 쌍은 사용되어, 무작위화된 PAM 서열을 갖는 프로토스페이서의 풀 (pool)의 생성으로 이어진다.
둘째로, "프로토스페이서" 단편의 다운스트림에 6개의 무작위 뉴클레오티드의 도입을 일으키는 쌍은 사용되어, 무작위화된 PAM 서열을 갖는 프로토스페이서의 풀의 생성으로 이어진다.
생성된 단편은 pNW33n 벡터에 결찰되어, 6-뉴클레오티드 길이의 각 PAMs의 모든 가능한 4096의 다른 조합을 갖는, "프로토스페이서" 구축물의 4 풀을 생성한다. 조립된 DNA는 G. 써모데니트리피칸스 T12 세포의 형질전환을 위해 사용된다. 세포는 클로람페니콜 선택 (chloramphenicol selection) 상에 평판 배양되고 및 각 프로토스페이서 풀 유래의 2 x 106 이상의 세포는 풀이 될 (pooled) 것이다. 플라스미드 DNA는 풀로부터 추출되고, 표적 영역은 PCR 증폭될 것이며, 생성물은 딥 시퀀싱 (deep sequencing)을 위해 보내진다. 가장 적은 리드 (reads)를 갖는 PAMs은 활성인 것으로 고려될 것이고, 상기 공정은 이들 PAMs을 갖는 스페이서를 함유하는 pNW33n 구축물을 이용하여 오직 반복될 것이다. G. 써모데니트리피칸스 T12의 감소된 형질전환 효율은, PAMs의 활성을 확인하는 것이다.
실시 예 6. gtCas9에 대한 PAM 서열의 체외 결정
pRham:cas9gt 벡터의 구축
cas69gt 유전자는 BG6927 및 BG6928 프라이머를 사용하여, G. 써모데니트리피칸스 T12 게놈으로부터 PCR 증폭되고, pRham C-His Kan Vector (Lucigen)와 하나의 혼합물로 조합된다. 상기 혼합물은 제공된 프로토콜에 따라 E. cloni 열-수용능 세포 (thermo-competent cells)를 형질전환시키는데 사용된다. 100㎕의 형질전환 혼합물은 LB+50카나마이신 플레이트 (LB+50kanamycin plates)에 평판 배양하여 37℃에서 하룻밤 동안 성장된다. 형성된 E. cloni::pRham:cas9gt 단일 콜로니 중에서 무작위로 3개를 선택하고, 50㎍/㎖ 카나무신을 함유하는 10㎖ LB 배지에 접종하였다. 글리세롤 스톡 (Glycerol stocks)은, 20%(v/v)의 최종 농도까지 각 배양물 (culture) 1㎖에 멸균 글리세롤을 첨가하여 배양물로부터 준비된다. 글리세롤 스톡은 -80℃에서 저장된다. 각 배양물에서 나머지 9㎖는 "GeneJET Plasmid Miniprep Kit" (Thermoscientific) 프로토콜에 따라 플라스미드 단리를 위해 사용된다. 플라스미드는 cas9gt의 서열 검증 (verification)을 위해 보내지고, 플라스미드 중 하나는 올바른 서열을 가진 유전자를 포함하는 것으로 검증되었다. 상응하는 배양물은, gtCas9의 이종 발현 및 정제를 위해 더욱 사용된다.
E. cloni::pRham:cas9gt 벡터에서 gtCas9의 이종숙주 발현 (Heterologous Expression)
E. cloni::pRham:cas9gt 전배양물 (preculture)은 상응하는 글리세롤 스톡으로 10㎖ LB+50카나마이신을 접종하여 준비된다. 37℃ 및 180rpm에서 하룻밤 동안 성장시킨 후, 전배양물 2㎖는, 200㎖의 LB+50카나마이신 배지를 접종하기 위해 사용된다. E. cloni::pRham:cas9gt 배양물은, 37℃, 180rpm에서, OD600이 0.7이 될때까지 배양된다. gtCas9 발현은 그 다음 L-람노오스를 0.2% w/v의 최종 농도로 첨가하여 유도된다. 발현은 8시간 동안 진행된 후, 배양물을 4700rpm, 10분 동안 4℃로 원심분리하여 세포를 얻었다. 배지는 폐기되고, 펠릿화된 세포는 -20℃에서 보관하거나 또는 다음의 프로토콜에 따라 무세포 추출물 (CFE)의 제조를 위해 사용된다:
1. 20㎖ 초음파분해 버퍼 (20mM 인산 나트륨 버퍼 (pH=7.5), 100mM NaCl, 5mM MgCl2, 5%(v/v) 글리세롤, 1mM DTT)에 펠릿을 재현탁.
2. 초음파분해로 1㎖의 세포를 분쇄 (30초의 8 펄스, 그 사이에서 얼음에서 20초 동안 냉각).
3. 불용성 부분을 침전시키기 위하여, 4℃, 35000g에서 15분 동안 원심분리.
4. 상등액을 제거하고 4℃ 또는 얼음에 보관.
gtCas9를 위한 sgRNA 모듈을 표적화하는 PAM 라이브러리의 디자인 및 구축
G. 써모데니트리피칸스 T12 균주의 게놈에서 tracrRNA 발현 DNA 모듈의 인실리코로 결정 후에 (상기 실시 예 4 참조), 단일 분자에서 CRISP/Cas9 시스템의 crRNA 및 tracrRNA 모듈들을 조합한 단일 가이드 (sg)RNA 발현 DNA 모듈은 디자인된다. sgRNA의 5'-말단의 스페이서는, 플라스미드 라이브러리의 프로토스페이서에 상보적으로 디자인되고, 모듈은 T7 프로모터의 전사 조절하에 놓여진다. pT7_sgRNA DNA 모듈은 베이스클리어 (Baseclear)에 의해 합성되고, pUC57 벡터에 수용되어, pUC57:pT7_sgRNA 벡터를 형성한다. DH5α 수용능 대장균 세포 (NEB)는 벡터로 형질전환되고, 형질전환 혼합물은 100㎍/㎖ 암피실린을 함유하는 LB-한천 플레이트 상에 평판 배양된다. 플레이트 (plates)는 37℃에서 밤새 배양된다. 형성된 단일 콜로니 중 3개는 100㎍/㎖ 암피실린을 함유하는 10㎖ LB 배지에 접종된다. 글리세롤 스톡은, 20%(v/v)의 최종 농도까지 각 배양물 1㎖에 멸균 글리세롤을 첨가하여 배양물로부터 준비된다. 글리세롤 스톡은 -80℃에서 보관된다. 각 배양물에서 나머지 9㎖는 "GeneJET Plasmid Miniprep Kit" (Thermoscientific) 프로토콜에 따라 플라스미드 단리를 위해 사용된다. 단리된 플라스미드는, pT7_sgRNA 모듈의 증폭을 위한 PCR 주형으로 사용된다. 218bp 길이의 pT7_sgRNA DNA 모듈 (이의 처음 18bp는 pT7에 상응함)은, 프라이머 BG6574 및 BG6575를 사용하여 얻어진다. 완전한 PCR 혼합물은, 1.5% 아가로즈 겔에서 실행된다. 원하는 크기의 밴드는 잘라내고, "Zymoclean™ Gel DNA Recovery Kit" 프로토콜에 따라 정제된다.
시험관 내 전사 (IVT)는, "HiScribe™ T7 고 수율 RNA 합성 키트" (NEB)를 사용하여 수행된다. 정제된 pT7_sgRNA DNA 모듈은, 주형으로 사용된다. IVT 혼합물은, 동일 부피의 RNA 로딩 염료 (RNA loading dye) (NEB)와 혼합되고, 70℃에서 15분 동안 가열되어 2차 구조를 파괴하였다. 열처리된 IVT 혼합물은 변성 우레아-PAGE 상에서 실행되고, 그 결과로 생긴 폴리아크릴아미드 겔은 염색을 목적으로 10㎕의 SYBR Gold (Invitrogen)를 함유하는 100㎖ 0.5x TBE 버퍼에서 10분 동안 처리된다. 원하는 크기 (200nt)의 밴드는 잘라내고, sgRNA는 다음의 RNA 정제프로토콜에 따라 정제된다:
1. 메스 (scalpel)로 RNA 겔 단편을 절단하고, RNA 용출 버퍼 1㎖를 첨가하여, 밤새 실온에서 놓음.
2. 새로운 1.5㎖ 튜브에 330㎕ 앨리쿼트 (aliquots)로 나눔.
3. 3 부피 (990㎕)의 사전-냉각된 (-20℃) 100% EtOH을 첨가.
4. -20℃에서 60분 동안 배양.
5. 실온에서 소형원심분리기로 13000rpm에서 20분 동안 원심분리.
6. EtOH를 제거하고 1㎖ 70% EtOH로 펠릿을 세척.
7. 실온에서 소형원심분리기로 13000rpm으로 5분 동안 원심분리.
8. 990㎕의 상등액을 제거.
9. 남은 EtOH를 열혼합기 (thermomixer)에서 55℃로 15-20분 동안 증발.
10. 20㎕ MQ에 재현탁된 펠릿을 -20℃에서 보관.
7nt 길이의 PAM 라이브러리의 디자인 및 구축, 및 라이브러리의 선형화 (linearization)
PAM 라이브러리의 디자인 및 구축은 pNW33n 벡터에 기초한다. 20bp 길이의 프로토스페이서는 벡터에 도입되고, 7 축퇴 뉴클레오티드 길이의 서열에 의해 이의 3' 측의 옆에 위치되며; 상기 축퇴 서열은 PAM으로 역할을 하고, 프로토스페이서가 우측 PAM에 의해 측면에 위치되는 경우, 이것은 Cas9로 로딩되고 절단된 sgRNA에 의해 표적으로서 인지될 수 있다. PAM 라이브러리는 다음의 프로토콜에 따라 제조된다:
1. 단일 가닥 DNA 올리고 1 (BG6494) 및 2 (BG6495)를 어닐링하여 SpPAM 이중 가닥 DNA 인서트 (DNA insert)를 준비.
Ⅰ. 10㎕ 10x NEBuffer 2.1
Ⅱ. 1㎕ 50㎛ 올리고 1 (~1.125㎍)
Ⅲ. 1㎕ 50㎛ 올리고 2 (~1.125㎍)
Ⅳ. 85㎕ MQ
V. 혼합물을 94℃에서 5분 동안 배양하고, 37℃에서 0.03℃/sec의 속도로 냉각.
2. 어닐링된 올리고 혼합물에 1㎕ Klenow 3' → 5' 엑소- 폴리머라제(NEB)를 첨가한 후, 2.5㎕의 10μM dNTPs를 첨가. 37℃에서 1시간, 그 다음 75℃에서 20분 동안 배양.
3. 46㎕의 어닐링 혼합물에 2㎕의 HF-BamHI 및 2㎕의 BspHI 제한 효소를 첨가. 37℃에서 1시간 동안 배양. 이 공정은 점착성 말단 (sticky ends)을 갖는 SpPAMbb 인서트로 이어질 것임. Zymo DNA 세정 및 농축기 키트 (Zymo Research)를 사용하여, 생성된 인서트을 세정.
4. HF-BamHI 및 BspHI (NEB)로 pNW33n을 소화 (Digest), 및 Zymo DNA 세정 및 농축기 키트 (Zymo Research)를 사용하여, 점착성 말단을 갖는 3.400bp 길이의 선형 pNW33nbb 단편을 정제.
5. 제공된 프로토콜에 따라 NEB T4 리가아제를 사용하여 11ng의 SPPAMbb 인서트로 50ng의 pNW33nBB를 결찰. Zymo DNA 세정 및 농축기 키트 (Zymo Research)를 사용하여 결찰 혼합물 (ligation mixture)을 정제.
6. DH10b 전기-수용능 세포 (500ng의 DNA를 가진 200㎕의 세포)를 형질전환. SOC 배지에 세포 (800㎕ SOC에 200㎕ 세포)를 1시간 동안 회수한 다음, 회수된 세포로 50㎖의 LB+12.5㎍/㎖ 크로람페니콜에 접종. 배양물을 37℃에서 180rpm으로 밤새 배양.
7. JetStar 2.0 maxiprep kit (GENOMED)를 사용하여 배양물로부터 플라스미드 DNA를 단리.
8. 단리된 플라스미드를 선형화하기 위해 제공된 프로토콜에 따라 SapI (NEB) 제한효소를 사용.
PAM 결정 반응의 디자인 및 실행
다음의 절단 반응은, 표적화된 프로토스페이서의 3' 말단의 다운스트림에 우측 PAM을 함유하는 PAM 라이브러리 멤버로 dsDNA 절단 (dsDNA breaks)의 gtCas9-유도 도입을 위해 설정된다:
1. 반응 당 2.5㎍의 E. cloni::pRham:cas9gt CFE
2. 30nM 최종 농도로 sgRNA
3. 반응 당 200ng의 선형화된 PAM 라이브러리
4. 2㎕의 절단 버퍼 (100mM 인산 나트륨 버퍼 (pH=7.5), 500mM NaCl, 25mM MgCl2, 25%(v/v) 글리세롤, 5mM DTT)
5. 20㎕ 최종 부피까지 MQ 수 (MQ water)
반응은 60℃에서 1시간 동안 배양되고, 4㎕의 6x 겔 로딩 염료 (NEB)를 첨가 후에 중단된다. 반응 혼합물은 그 다음 1% 아가로즈 겔에 로딩된다. 상기 겔은 100V에서 1시간 15분간 전기영동한 후, 10㎕의 SYBR Gold 염료 (ThermoFisher)를 함유하는 100㎖ 0.5xTAE 버퍼에서 30분 동안 배양된다. DNA 밴드를 청색광으로 가시화한 후에, 성공적으로 절단 및 PAM을 함유하는 DNA 단편에 상응하는 밴드는 겔에서 잘라내고, 겔은 제공된 프로토콜에 따라 "Zymoclean™ Gel DNA Recovery Kit"을 사용하여 정제된다.
시퀀싱을 위한 PAM-함유 gtCAs9 절단된 DNA 단편의 태깅 (Tagging)
Cas9-유도된 DNA 절단은, 보통 PAM 서열에 가까운 쪽에, 프로토스페이서의 3rd와 4th 뉴클레오티드 사이에 도입된다. 결과적으로, 서열을 추가하고, PAM 서열을 결정하기 위해, 절단된 DNA 단편의 PAM-함유 부분을 PCR 증폭할 수 있는 한 쌍의 프라이머를 디자인하는 것은 가능하지 않다. 이 목적을 위해, 5-단계 공정은 사용된다:
단계 1: Taq 폴리머라제로 A-테일링 (A-Tailing)
A-테일링은, Taq 폴리머라제를 사용하여 무딘, 이중-가닥 DNA 분자의 3' 말단에 주형이 없는 아데닌 (non-templated adenine)을 추가하는 과정이다.
반응 성분:
· gtCas9-절단 및 PAM-함유 DNA 단편 - 200ng
· 10X ThermoPol® Buffer (NEB) - 5 ㎕
· 1 mM dATP - 10 ㎕
· Taq DNA 폴리머라제(NEB) - 0.2㎕
· H2O - 50㎕까지의 최종 반응 부피
· 배양 시간 - 20분
· 배양 온도 - 72℃
단계 2: 시퀀싱 어댑터 (sequencing adaptors)의 구축
2개의 상보적인 짧은 ssDNA 올리고뉴클레오티드는 인산화되고, 어닐링되어 단계 1 유래의 DNA 단편의 PAM-근위 부위 (PAM-proximal site)에 대한 시퀀싱 어댑터를 형성한다. 올리고뉴클레오티드 중 하나는, A-테일화된 단편에 어댑터의 결찰을 촉진하기 위해 이의 3' 말단에 부가적인 티민을 갖는다.
어댑터 올리고뉴클레오티드 인산화 (각 올리고에 대한 개별 인산화 반응)
· 100 μM 올리고뉴클레오티드 스톡 - 2 ㎕
· 10X T4 DNA 리가아제버퍼 (NEB) - 2 ㎕
· 멸균 MQ 수 - 15 ㎕
· T4 폴리뉴클레오티드 키나제(NEB) - 1 ㎕
· 배양 시간 - 60분
· 배양 온도 - 37℃
· T4 PNK 비활성화 - 65℃에서 20분
인산화된 올리고뉴클레오티드의 어닐링
· 상응하는 인산화 혼합물 유래의 올리고뉴클레오티드 1 - 5㎕
· 상응하는 인산화 혼합물 유래의 올리고뉴클레오티드 1 - 5㎕
· 멸균 MQ 수 - 90㎕
· 인산화된 올리고를 95℃에서 3분 동안 배양. ~30분 내지 1시간 동안 실온에서 천천히 반응을 냉각.
단계 3: 시퀀싱 어댑터로 gtCas9-절단된, A-테일화된 단편의 결찰
단계 1 및 2의 생성물은 다음의 프로토콜에 따라 결찰된다:
· 10X T4 DNA 리가아제버퍼 - 2㎕
· 생성물 단계 1 - 50 ng
· 생성물 단계 2 - 4 ng
· T4 DNA 리가아제- 1㎕
· 멸균 MQ 수 - 20㎕까지
· 배양 시간 - 10분
· 배양 온도 - 20∼25℃
· 65℃에서 10분 동안 가열 비활성화
단계 4: 150-뉴클레오티드 길이의 PAM-함유 단편의 PCR 증폭
단계 4의 결찰 혼합물 5㎕는, Q5 DNA 폴리머라제(NEB)를 사용하여 PCR 증폭을 위한 주형으로 사용된다. 단계 2 유래의 티민 연장을 갖는 올리고뉴클레오티드는, 정방향 프라이머로 사용되고, 역방향 프라이머는 PAM 서열의 다운스트림에 150 뉴클레오티드을 어닐링하도록 디자인된다.
동일한 서열은 주형으로서 비-gtCas9 처리된 PAM-라이브러리 DNA를 사용하여 증폭된다. PCR 생성물 모두는 겔 정제되고, Illumina HiSeq 2500 쌍-말단 시퀀싱 (paired-end sequencing) (Baseclear)을 위해 보내진다.
시퀀싱 결과의 분석 및 후보 PAM 서열 (candidate PAM sequence)의 결정
시퀀싱 결과를 분석한 후, 다음의 빈도 행렬 (frequency matrices)은 구축된다. 행렬은 gtCas9 소화된 (digested) 및 비-소화된 라이브러리의 모든 PAM 위치에서 각 뉴클레오티드의 상대 존재비 (abundance)를 묘사한다:
|
비-소화된
|
pos1
|
pos2
|
pos3
|
pos4
|
pos5
|
pos6
|
pos7
|
|
A
|
19.22 |
20.83 |
19.12 |
24.43 |
24.59 |
21.75 |
18.22 |
|
C
|
34.75 |
30 |
31.9 |
30.54 |
25.96 |
27.9 |
27.17 |
|
T
|
19.16 |
22.19 |
25.34 |
21.28 |
26.09 |
26 |
21.56 |
|
G
|
26.87 |
26.98 |
23.64 |
23.75 |
23.36 |
24.35 |
33.05 |
| |
|
|
|
|
|
|
|
|
소화된
|
pos1
|
pos2
|
pos3
|
pos4
|
pos5
|
pos6
|
pos7
|
|
A
|
10.63 |
18.65 |
14.6 |
14.49 |
3.36 |
8.66 |
27.54 |
|
C
|
66.22
|
49.59
|
56.82
|
60.35
|
92.4
|
62.26
|
34.94 |
|
T
|
8.09 |
11.21 |
19.12 |
12.15 |
2.35 |
14.66 |
5.58 |
|
G
|
15.05 |
20.54 |
9.45 |
13.01 |
1.89 |
14.43 |
31.94 |
이들 결과는 5th PAM 위치에서 시토신을 가진 표적에 대한 명확한 선호도 및 처음 4 PAM 위치에서 시토신을 갖는 표적에 대한 선호도를 나타낸다.
실시 예 7: gtCas9에 대한 인실리코 PAM 예측
PAMs의 인실리코 예측은, 충분한 프로토스페이서 서열이 게놈 데이터베이스에서 이용 가능하다면 가능하다. gtCas9 PAM의 인실리코 예측은, GenBank와 같은 게놈 데이터베이스의 서열과 비교하여 G. 써모데니트리피칸스 T12 균주의 게놈에서 CRISPR 어레이 유래의 스페이서의 히트 (hits)의 동정으로 시작한다. "CRISPR 화인더" (http://crispr.u-psud.fr/Server/) 도구는 T12에서 후보 CRISPR 유전자좌를 동정하는데 사용된다. 동정된 CRISPR 유전자좌 출력은 그 다음, 선택된 데이터베이스를 검색하고, 일치하는 프로스페이서로 출력을 제공하는, "CRISPR 표적 (jhttp://bioanalysis.otago.ac.nz/CRISPRTarget/crispr_analysis.html) 도구에 로딩된다. 이들 프로토스페이서 서열은 그 다음 유일무이한 히트 (unique hits) 및 스페이서에 대한 상보성에 대해 스크리닝된다 - 예를 들어, 시드 서열에서 불일치는 유망한 거짓 양성 (false positive) 히트인 것으로 고려되고, 추후 분석에서 배제된다. 프로파지 서열 (prophage sequences) 및 (인터그레이션된) 플라스미드에 대해 동일성을 갖는 히트는 얻어진 히트가 참 양성 (true positives)인 것을 입증한다. 전반적으로, 이 과정은 6개 단일 히트를 산출한다 (도 7). 그 결과로서, 남아있는, 유일무이한 프로토스페이서 히트의 플랜킹 영역 (Type II gtCas 뉴클레아제에 대해 3')은 WebLogo (http://weblogo.berkeley.edu/logo.cgi) (Crooks GE, Hon G, Chandonia JM, Brenner SE WebLogo: A sequence logo generator, Genome Research, 14:1188-1190, (2004)) 도구를 사용하여 컨센서스 서열 (consensus sequences)에 대해 정렬 및 비교된다 (도 8).
인실리코 결과는, PAM 서열의 5th 잔기의 동일성에 대한 편중 (bias)이 시토신인 것으로 시험관 내 PAM 동일성 실험 결과 (실시 예 6 참조)와 비슷하다.
실시 예 8: gtCas9에 대한 8 뉴클레오티드 길이의 PAM 서열의 결정
실시 예 8의 인실리코 데이터는, gtCas9가 8th 위치에서 아데노신에 대해 약간의 선호도가 있음을 시사하고, 따라서 추가의 PAM 결정 실험은 수행되며, 여기서 PAM 서열의 8th 위치는 또한 시험된다. 이것은 프로토스페이서의 3' 말단에서 5th 및 8th 위치들 사이에서 연장된 것으로 확인된 중온성 Brevibacillus laterosporus SSP360D4 (Karvelis et al., 2015) Cas9 PAM 서열의 특징과 일치한다.
PAMs의 특이적 8 뉴클레오티드-길이 변이체는, gtCas9로 시험된다:
1) CNCCCCAC [SEQ ID NO: 17],
2) CCCCCCAG [SEQ ID NO: 18],
3) CCCCCCAA [SEQ ID NO: 11],
4) CCCCCCAT [SEQ ID NO: 19],
5) CCCCCCAC [SEQ ID NO: 20],
6) NNNNTNNC (음의 대조군 PAM)
정제된 gtCas9 및 이전과 동일한 sgRNA (실시 예 6 참조)로 이들 (비-선형화된) 플라스미드를 표적화하는 60℃에서 시험관 내 절단 분석을 수행한 후에, CCCCCCAA [SEQ ID NO: 11] 서열이 PAM으로 사용된 경우 증가된 gtCas9 절단 활성은 관찰된다 (도 9). 그러나, 절단 활성은 모든 시험된 PAM 서열에 대해 명확하게 검출 가능하였으며, 음성 대조군 PAM 서열에 대해서도 희미한 절단 밴드가 관찰되었다. 특정 이론에 구속되는 것을 원하지는 않지만, 높은 gtCas9 농도의 사용은, 음성 대조군에서 관찰된 절단에 기여할 가능성이 있다. 시험관 내 분석에서 높은 Cas9 농도는, 절대 PAM 요건 없이 Cas9-유도된 DNA 절단으로 이어지는 것으로 일반적으로 관찰된다.
Cas9 농도는 일반적으로 Cas9 유도된 DNA 절단의 효율에 영향을 미치는 것으로 알려져 있다 (높은 Cas9 농도는, 더 높은 Cas9 활성을 결과한다). 이것은, CCCCCCAA [SEQ ID NO: 11] PAM 서열 및 다른 gtCas9 농도로 표적화된 플라스미드를 사용하여 시험관 내 분석을 수행하는 경우 또한 관찰된다 (도 10).
전술된 바와 같은 시험관 내 분석을 위한 CCCCCCAA [SEQ ID NO: 11] PAM 서열로 표적화된 플라스미드는 38 내지 78℃의 넓은 온도 범위에서 수행된다 (도 11). 놀랍게도, gtCas9는 모든 온도에서 활성이었고, 40.1 내지 64.9℃에서 가장 높은 활성을 보인다.
따라서, 지오바실러스 종 유래의 Cas9의 최적 온도 범위는, 현재까지 특징화된 Cas9 단백질의 온도 범위보다 훨씬 높다. 유사하게, 이것이 뉴클레아제활성을 보유하는 범위의 상한은, 공지된 Cas9 단백질의 것보다 훨씬 높다. 더 높은 최적 온도 및 기능적 범위는, 고온의 유전 공학에서 상당한 장점을 제공하며, 따라서 상승된 온도에서 수행된 다양한 산업, 농업 및 제약 공정에서 유용성을 갖는, 호열성 유기체의 게놈을 편집하는데, 상당한 장점을 제공한다.
실시 예 9: gtCas9 및 8개의 뉴클레오티드 길이 PAM 서열로 바실러스 스미시이 ET138의 생체 내 게놈 편집
8개의 뉴클레오티드 PAM이 또한 생체 내에서 gtCas9에 의해 인지되는지를 확인하기 위해, 실험은 55℃에서 바실러스 스미시이 ET138의 게놈에서 pyrF 유전자가 결손되도록 디자인된다.
이 방법은 표적 (pyrF) 유전자의 업스트림 및 다운스트림에 상보적인 영역이 B. 스미시이 ET 138 세포에 제공되는 상동 재조합 주형 구축물을 제공하는 것에 의존한다. 주형의 도입은, 상동 재조합의 과정이 (pyrF 유전자가 없는) 상동 재조합 주형을 게놈으로 도입하는데 사용되는 것을 허용하여 세포의 게놈에서 WT pyrF 유전자를 대체한다.
상동 재조합 구축물에 gtCas9 및 sgRNA의 포함은, WT pyrF를 함유하는 박테리아 게놈으로 이중 가닥 DNA 절단 (DSDBs)를 도입하는데 사용될 수 있다. 박테리아 게놈의 DSDBs는 통상적으로 세포 죽음을 결과한다. 따라서, WT pyrF에서 서열을 인식하는 sgRNA는, DSDB 및 단지 WT pyrF를 함유하는 세포의 죽음을 결과할 수 있다. DSDB의 도입은 또한 gtCas9에 의해 인식되는 프로토스페이서의 3' 말단에서 다운스트림에 위치하는 적절한 PAM 서열에 의존한다.
pNW33n 플라스미드는 클론 (clone)을 만들기 위한 백본으로 사용된다:
i) 사내에서 개발된 글루코오스 억제성 프로모터의 제어하에 있는 cas9gt 유전자; 및
ⅱ) B. 스미시이 ET138의 게놈으로부터 pyrF 유전자의 결손을 결과하는 상동 재조합을 위한 주형으로서 B. 스미시이 ET138의 게놈에서 pyrF 유전자의 1kb 업스트림 및 1kb 다운스트림 영역; 및
ⅲ) 구성적 프로모터의 전사 조절하에 있는 단일 가이드 RNA (sgRNA) 발현 모듈.
3개의 개별 구축물은 생성되고, 여기서, gtCas9를 게놈 내에 이의 특이적 DNA 표적 (또한, 스페이서로 알려짐)으로 안내하는 서열에 상응하는, 처음 20개 뉴클레오티드에서 단일 가이드 RNA의 서열은 다르다. 3개의 다른 스페이서 서열은, B. 스미시이 ET138의 pyrF 유전자에서 3개의 다른 후보 프로토스페이서를 표적으로 하도록 디자인된다. 상기 구축물은 여기서 구축물 1, 2 및 3으로 각각 지칭된다.
3개의 다른 표적화된 프로토스페이서는, 이들의 3'-말단에서 다음의 후보 PAM 서열을 갖는다:
1. TCCATTCC (시험관 내 분석의 결과에 따른 음성 대조군; 구축물 번호 3에 인코딩된 sgRNA에 의해 표적화된 프로토스페이스의 3'-말단)
2. ATCCCCAA (구축물 번호 1에 인코딩된 sgRNA에 의해 표적화된 프로토스페이서의 3'-말단 [SEQ ID NO: 21])
3. ACGGCCAA (구축물 번호 2에 인코딩된 sgRNA에 의해 표적화된 프로토스페이서의 3'-말단, [SEQ ID NO: 22])
B. 스미시이 ET 138 세포를 3개의 구축물 중 하나로 형질전환 및 선택 플레이트 상에 도말한 후에, 다음의 결과는 얻어진다:
1. 세포가 3' 말단에서 음성 대조군 TCCATTCC PAM 서열을 갖는 프로토스페이서를 표적으로 하는 구축물로 형질전환된 경우 (구축물 번호 3), 형질전환 효율은 영향을 받지 않았다 (도 12 A). 콜로니의 수는, pNW33n 양성 대조군 구축물로 형질전환 후에 콜로니의 수와 같은 범위였다 (도 12 B). pyrF 유전자가 결손된 콜로니를 스크리닝하기 위해 콜로니 PCR에 적용된 15개의 콜로니 중에서, 결손 유전자형 -2.1kb 예상 밴드 크기-을 나타내지 않았고, 모두 야생형 -2.9kb 예상된 밴드 크기-이다 (도 13). 이것은 시험된 PAM이 실제로 생체 내에서 gtCas9에 의해 인지되지 않음을 나타낸다.
2. 세포가 구축물 번호 1로 형질전환된 경우, 양성 대조군 (pNW33n으로 형질전환된 세포)과 비교했을 때 소수의 콜로니는 얻어진다 (도 12 C). 20개의 콜로니는 콜로니 PCR에 적용되어 pyrF 유전자가 결손된 콜로니를 스크린한다. 대다수 (19개)의 콜로니는, 야생형 및 pyrF 결손 유전자형 모두를 함유하는 반면, 하나의 콜로니는 pyrF 결손 유전자형을 갖는다 (도 14). 이 결과는, WT 만의 유전자형이 관찰되지 않았기 때문에 PAM 서열 ATCCCCAA [SEQ ID NO: 21]이 gtCas9에 의해 생체 내에서 인지된다는 것을 나타낸다. 감소된 형질전환 효율은 또한 세포 군의 비율이 감소되었음을 나타내고, 이는 gtCas9에 의한 성공적인 표적화로 인해 DSDB에 의한 WT 만의 유전자형 세포로 유발된 세포 죽음에 기인할 수 있다.
3. 세포가 구축물 번호 2로 형질전환된 경우, 콜로니는 얻어지지 않는다 (도 12 D). 콜로니의 결핍은 모든 세포 군이 gtCas9에 의해 성공적으로 표적화되어, DSDB에 의한 세포 죽음으로 이어졌다는 것을 나타낸다. 이것은 ACGGCCAA [SEQ ID NO: 22] PAM 서열이 gtCas9에 의해 인지된 것을 시사한다.
이들 결과는, 시험관 내 PAM 결정 결과와 일치하는 결과인, gtCas9가 전술된 PAM 서열을 갖는 생체 내 55℃에서 활성인 것을 나타낸다. 게다가, 이것은 플라스미드 유래 상동 재조합 주형과 조합하여 동일한 온도에서 게놈 편짐 도구로 사용될 수 있다.
실시 예 10: ThermoCas9 동정 및 정제
65℃에서 최적의 성장 온도를 갖는 그람 양성, 중간 정도의 호열성 박테리아인, 지오바실러스 써모데니트리피칸스 T12 균주 (Daas et al. Biotechnol. Biofuels 9, 210 (2016))는, 단리되고, 염기서열이 결정되었다. 타입 Ⅱ CRISPR-Cas 시스템이 호열성 박테리아에 존재하지 않는다는 이전의 주장 (Li et al, Nucleic Acids Res. 44, e34-e34 (2016))과는 달리, 시퀀싱 결과는, G. 써모데니트리피칸스 T12의 게놈에서 타입-ⅡC CRISPR-Cas 시스템의 존재를 밝혔다 (도 15의 A). 이 시스템의 Cas9 엔도뉴클레아제(ThermoCas9)는, SpCas9 (1368 아미노산)와 같은, 다른 Cas9 상동유전자와 비교하여 상대적으로 작은 (1082 아미노산) 것으로 예견된다. 크기 차이는, 다른 작은 Cas9 상동유전자에 대해 입증된 것처럼, 잘린 REC 로브에 대부분 기인한다 (도 19) (Ran et al. Nature 520, 186-191 (2015)). 더군다나, ThermoCas9는, G. 써모데니트리피칸스 T12의 적어도 최적 온도 부근에서 활성인 것으로 예상된다 (Daas et al. Biotechnol. Biofuels 9, 210 (2016)). 질의 서열로서 ThermoCas9 서열을 사용하여, BLAST-P 검색은, NCBI/비-중복 단백질 서열 (non-redundant protein sequences) 데이터세트에서 수행되었고, 다수의 매우 동일한 Cas9 상동유전자는, ThermoCas9가 호열성 박테리아의 고도로 보존된 방어 시스템의 일부라는 생각을 뒷받침하는 (도 15의 B), 대부분 지오바실러스 속으로 (단백질 수준에서 87-99%의 동일성, 표 2) 확인되었다. 이들 특징은, 이것이 호열성 미생물에 대한 게놈 편집 및 침묵 도구로서 이용을 위한, 및 향상된 단백질 견고성 (protein robustness)이 요구되는 조건을 위한, 가능한 후보물질일 수 있음을 시사한다.
처음에 전술된 접근법을 사용하여 G. 써모데니트리피칸스 T12 CRISPR-Cas 시스템의 crRNA 및 tracrRNA 모듈의 인실리코 예측은 수행되었다 (Mougiakos et al. Trends Biotechnol.34, 575-587 (2016), Ran et al. Nature 520 , 186-191 (2015)). 이 예측에 기초하여, 190nt sgRNA 키메라는, 예측된 전체 크기의 crRNA (30nt 길이의 스페이서 다음에 36nt 길이의 반복) 및 tracrRNA (36nt 길이의 안티-반복 다음에, 3개의 예측된 헤어핀 구조를 갖는 88nt 서열)를 연결하여 디자인된다. ThermoCas9는, E.coli에서 이종방식으로 발현되고, 동질성으로 정제된다. ThermoCas9에 sgRNA의 로딩이 단백질을 안정화시킬 것으로 가정하면서, 시험관 내 전사된 sgRNA로 로딩된, 정제된 apo-ThermoCas9 및 ThermoCas9는 60℃ 및 65℃에서 15분 및 30분 동안 배양된다. SDS-PAGE 분석은, 정제된 ThermoCas9가 65℃에서 변성되지만, 60℃에서는 변성되지 않는 반면, ThermoCas9-sgRNA 복합체의 변성 온도가 65℃ 이상임을 보여준다 (도 15의 C). ThermoCas9의 입증된 열안정성은, 내열성 CRISPR-Cas9 게놈 편집 도구로서 이의 잠재성을 암시하며, 몇몇 관련 분자 특색을 좀 더 상세히 분석하는데 도움이 되었다.
ThermoCas9와 비교한 도 1의 Cas9 단백질 서열의 pBLAST 결과.
| 종 |
% 동일성a |
| Geobacillus 47C-IIb |
99 |
| Geobacillus 46C-IIa |
89 |
| Geobacillus LC300 |
89 |
|
Geobacillus jurassicus
|
89 |
| Geobacillus MAS1 |
88 |
|
Geobacillus stearothermophilus
|
88 |
| Geobacillus stearothermophilus ATCC 12980 |
88 |
| Geobacillus Sah69 |
88 |
|
Geobacillus stearothermophilus
|
88 |
|
Geobacillus kaustophilus
|
88 |
|
Geobacillus stearothermophilus
|
88 |
| Geobacillus genomosp. 3 |
87 |
| Geobacillus genomosp. 3 |
87 |
|
Geobacillus subterraneus
|
87 |
|
Effusibacillus pohliae
|
86 |
실시 예 11: ThermoCas9 PAM 결정
ThermoCas9의 특징화를 향한 제1 단계는, DNA 표적의 성공적인 절단을 위한 이의 PAM 선호도의 인실리코 예측이다. G. 써모데니트리피칸스 T12 CRISPR 유전자좌의 10개의 스페이서는, CRISPRtarget (Biswas et al, RNA Biol. 10, 817-827 (2013))을 사용하여 바이러스 및 플라스미드 서열에서 잠재적인 프로토스페이서를 조사하기 위해 사용된다. 단지 2개의 히트가 파지 게놈으로 얻어짐에 따라 (도 20의 A), 이것은 시험관 내 PAM 결정법으로 진행하기로 결정했다. 선형 dsDNA 기질을 표적으로 하는 ThermoCas9-계에 대한 스페이서를 함유하는 예측된 sgRNA 서열은 매칭 프로토스페이서로 전사된다. 프로토스페이서는 무작위화된 7-염기 쌍 (bp) 서열에 의해 이의 3'-말단에서 측면에 위치된다. 55℃에서 ThermoCas9-계 절단 분석을 수행한 후, (대조군로서 비-표적화된 라이브러리 샘플과 함께) 라이브러리의 절단된 멤버 (cleaved members)는, 딥-시퀀싱하고, ThermoCas9 PAM 선호도를 확인하기 위해 비교된다 (도 16의 A). 시퀀싱 결과는, ThermoCas9가 중온성 Cas9 변이체와 유사하게, 3rd 및 4th PAM 근위 뉴클레오티드 사이에 대부분 위치하는 이중 가닥 DNA 절단을 도입한다는 것을 밝혀냈다. 게다가, 절단된 서열은, ThermoCas9가, 1st, 3rd, 4th 및 6th PAM 위치에서 시토신에 대한 미묘한 선호도 (subtle preference)로, 5'-NNNNCNR-3' PAM을 인식한다는 것을 밝혀냈다 (도 16의 B). 최근의 연구는, 특정 타입 ⅡC Cas9 상동유전자의 표적 인식을 위한 8th PAM 위치의 중요성을 밝혀냈다 (Karvelis et al. Genome Biol. 16, 253 (2015); Kim et al. Genome Res. 24, 1012-9 (2014)). 이러한 목적을 위해, 인실리코 ThermoCas9 PAM 예측으로부터의 결과를 고려하여, 부가적인 PAM 결정 분석은 수행되었다. 이것은 8th PAM 위치에서 아데닌의 존재하에서 최적의 표적화 효율을 나타낸다 (도 16의 C). 흥미롭게도, 히트 수가 제한되어 있음에도 불구하고, 전술된 인실리코 PAM 예측 (도 20의 B)은 또한, 8th PAM 위치에서 아데닌 및 5th PAM 위치에서 시토신의 중요성을 제시한다. 6th 및 7th PAM 위치에서 PAM의 모호성을 더욱 명확히하기 위해, 한 세트의 16개의 다른 표적 DNA 단편은 발생되고, 여기서, 매칭 프로토스페이서는 5'-CCCCCNNA-3' [SEQ ID NO: 13] PAMs 옆에 위치된다. (각각 6th 및 7th 뉴클레오티드의 독특한 조합으로) 이들 단편의 절단 분석은, 다른 구성삽입 인자 (TermoCas9, sgRNA 가이드, dsDNA 표적)들이, 이들을 조합하고 상응하는 분석 온도에서 1시간 동안 배양하기 전에, 다른 온도 (20, 30, 37, 45, 55 및 60℃)에서 10분 동안 개별적으로 사전-가열되어 수행된다. 분석이 37℃ 내지 60℃의 온도에서 수행되는 경우, 모든 다른 DNA 기질은, 절단된다 (도 16의 D, 도 21). 그러나, 대부분 소화된 표적 단편은, PAM 서열 (5th 내지 8th PAM 위치) 5'-CNAA-3' 및 5'-CMCA-3'로 이루어진 반면, 최소 소화된 표적은, 5'-CAKA-3' PAM을 함유한다. 30℃에서, 최적의 PAM 서열 (5th 내지 8th PAM 위치) 5'-CNAA-3' 및 5'-CMCA-3'을 갖는 DNA 기질의 절단만이 관찰되었다 (도 16의 D). 마지막으로, 20℃에서, (5th 내지 8th PAM 위치) 5'-CVAA-3' 및 5'-CCCA PAM 서열을 갖는 DNA 기질만이 표적이 되어 (도 21), 이들 서열을 가장 바람직한 PAMs으로 만든다. 이들 연구 결과들은, 이의 저온 한계에서 ThermoCas9가 바람직한 PAM으로 단편을 오직 절단한다는 것을 입증한다. 이러한 특징은, 생체내 편집 과정 동안, 예를 들어, 오프-타겟 효과 (off-target effects)를 피하기 위해 이용될 수 있다.
실시 예 12: 열안정성 및 절단 (truncations)
예측된 tracrRNA는, 안티-반복 영역 다음에 3개의 헤어핀 구조로 이루어진다 (도 17의 A). sgRNA 키메라를 형성하기 위해 crRNA와 함께 tracrRNA의 사용은, DNA 기질의 성공적인 가이드된 절단을 결과한다. 이중 가이드의 비변성 상태와 가장 유사할 가능성이 가장 큰, 전체-길이 반복-안티-반복 헤어핀의 스페이서 원위 단부의 41-nt 길이의 결손 (도 17의 A)은, DNA 절단 효율에 거의 영향이 없는 것으로 관찰되었다. ThermoCas9의 절단 효율에 대한 예측된 헤어핀 (도 17의 A)의 추가 절단의 효과는, 모든 구성삽입 인자 (sgRNA, ThermoCas9, 기질 DNA)들이, 이들을 조합하고 다양한 분석 온도 (37-65℃)에서 1시간 동안 배양하기 전에, 다른 온도 (37-65℃)에서 1, 2, 및 5분 동안 개별적으로 사전-가열되는, 절단 시계-열 (cleavage time-series)을 수행하여 평가된다. tracrRNA 스캐폴드의 예견된 스템-루프의 수는, DNA 절단에서 결정적인 역할을 하는 것으로 보이고; 3개의 루프가 모두 존재하는 경우, 절단 효율은 모든 시험 온도에서 가장 높은 반면, 효율은 3' 헤어핀의 제거시 감소하였다 (도 17의 B). 게다가, 중간 및 3' 헤어핀 모두 제거시 절단 효율은 급격히 떨어졌다 (도 22). 65℃에서 1분 또는 2분 동안 ThermoCas9의 사전-가열이 검출 가능한 절단을 결과하는 반면, 절단 활성은 5분 배양 후 완전히 없어졌다. 열안정성 분석은, 3' 스템-루프가 없는 sgRNA 변이체가 65℃에서 ThermoCas9 단백질의 감소된 안정성을 결과하여, 전체 길이 tracrRNA가 상승된 온도에서 최적의 ThermoCas9-계 DNA 절단을 위해 필요하다는 것을 나타낸다. 부가적으로, 우리는 또한 스페이서 서열의 길이를 (25nt에서 18nt로) 변화시켰고, 23, 21, 20 및 19nt의 스페이서 길이가 가장 높은 효율로 표적을 절단한다는 것을 확인했다. 18nt의 스페이서가 사용되는 경우, 절단 효율은 현저히 떨어진다.
생체 내에서 ThermoCas9:sgRNA RNP 복합체는, 아마도 수분 내에 형성될 것이다. 위의 연구 결과와 함께, RNP의 활성 및 열안정성은 평가된다. 미리-조립된 RNP 복합체는, 사전-가열된 DNA를 첨가하기 전 60, 65 및 70℃에서 5분 및 10분 동안 가열되고, 그 후에 60, 65 및 70℃에서 1시간 동안 배양된다. 놀랍게도, ThermoCas9 RNP는 70℃에서 5분 동안 이의 사전-가열에도 불구하고, 70℃까지 활성이었다 (도 17의 C). 이 연구 결과는, ThermoCas9 안정성이 적절한 sgRNA 가이드 (Ma et al., Mol. Cell 60, 398-407 (2015))와의 연관성과 밀접한 상관관계가 있다는 우리의 추정을 확인했다.
ThermoCas9가 넓은 온도 활성 범위를 갖는 것, 즉, 저온 및 고온 모두에서 기능적인 것으로, 몇몇 적용에서, 장점일 수 있다. 또한, 몇몇 상황에서, ThermoCas9의 활성이 더 좁은 온도 범위, 예를 들어, 오직 저온 또는 오직 고온에서 활성으로 제한될 수 있는 경우, 유리하다. 결과적으로, ThermoCas9 또는 (sgRNA와 같은) 관련 인자의 구조적 특색을 변형하여, ThermoCas9가 표적화된 절단 또는 결합이 가능하거나 또는 표적화된 절단 또는 결합이 효율적으로 일어나는, 온도 범위를 조작하기 위한 능력은, 핵산 서열 조작을 넘어 발휘되는 더 큰 수준의 제어를 가능하게 할 것이다. 그러므로, 우리는 ThermoCas9 온도 범위를 Streptococcus pyogenes Cas9 (SpCas9)의 온도 범위와 비교하는 것을 시작했다. 두 Cas9 동족체는 20 내지 65℃에서 시험관 내 활성 분석에 적용된다. 두 단백질은, sgRNA 및 표적 DNA 분자의 첨가 전에, 상응하는 분석 온도에서 5분 동안 배양된다. 이전의 분석과 일치하여, 중온성 SpCas9는, 25 내지 44℃에서만 오직 활성이었고 (도 17의 D); 이 온도 위에서, SpCas9 활성은 감지할 수 없는 수준으로 급격히 감소했다. 대조적으로, ThermoCas9 절단 활성은, 25 내지 65℃에서 감지될 수 있다 (도 17의 D). 이것은, ThermoCas9를 호열성 및 중온성 유기체 모두에 대한 게놈 편집 도구로 사용할 수 있는 가능성을 나타낸다.
이전에 특징화된, 중온성 Cas9 엔도뉴클레아제는, 표적 DNA에서 DSBs의 발생을 촉매하는 2가 양이온을 사용한다 (Jinek et al. Science 337, 816-821 (2012); Chen et al. J. Biol. Chem. 289, 13284-13294 (2014)). 어떤 양이온이 ThermoCas9에 의한 DNA 절단에 기여하는지 평가하기 위해, 플라스미드 절단 분석은, 다음의 2가 양이온: Mg2+, Ca2+, Mn2+, Co2+, Ni2+, 및 Cu2+ 중 하나의 존재하에서 수행되고; 양이온-킬레이트제(cation-chelating agent) EDTA을 이용한 분석은, 음성 대조군으로 포함된다. 예상된 바와 같이, 표적 dsDNA는, 2가 양이온의 존재하에서 절단되고, EDTA의 존재하에서 온전히 유지된다 (도 23의 A). 특정 타입-IIC 시스템이 효율적인 단일 가닥 DNA 가위라는 보고 (Ma et al. Mol. Cell 60, 398-407 (2015); Zhang et al. Mol. Cell 60, 242-255 (2015))에 기초하여, 우리는 ssDNA 기질에 대한 ThermoCas9의 활성을 시험했다. 그러나, 절단은 관찰되지 않았으며, 이는 ThermoCas9가 dsDNA 뉴클레아제임을 나타낸다 (도 23의 B).
실시 예 13: 호열성 박테리아 B. 스미시의 ThermoCas9-계 유전자 결손
ThermoCas9 I는 호열성 박테리아에 대한 게놈 편집 도구로서 검토했다. 여기서, 이것은 55℃에서 배양된 Bacillus smithii ET 138에서 나타낸다. 최소한의 유전자 부분 (genetic parts)을 사용하기 위해, 단일 플라스미드 접근법은 사용된다. 한 세트의 pNW33n-계 pThermoCas9 플라스미드는, 비변성 xylL 프로모터 (PxylL)의 제어하에 thermocas9 유전자, 또한 관심의 유전자 내에 Cas9-유도된 이중 가닥 DNA 절단을 복구하기 위한 상동 재조합 주형, 및 Bacillus coagulans 유래의 구성적 pta 프로모터 (Ppta)의 제어하의 sgRNA 발현 모듈을 함유하여 생산된다 (도 18의 A).
제1 목표는 B. smithii ET 138의 게놈으로부터 전체 길이 pyrF 유전자를 결손시키는 것이다. pNW33n-유래 플라스미드 pThermoCas9_bsΔpyrF1 및 pThermoCas9_bsΔpyrF2는, pyrF 유전자의 다른 부위를 표적으로 하는 스페이서를 갖는 다른 ThermoCas9 가이드의 발현에 사용되는 반면, 제3 플라스미드 (pThermoCas9_ctrl)는, sgRNA 발현 모듈에 무작위 비-표적화 스페이서를 함유한다. 대조군 플라스미드 pNW33n (가이드 없음) 및 pThermoCas9_ctrl로 55℃에서 B. smithii ET 138 수용능 세포의 형질전환은, 각 ~200 콜로니의 형성을 결과한다. 10개의 스크리닝된 pThermoCas9_ ctrl 콜로니 중에서, 어느 것도 ΔpyrF 유전자형을 함유하지 않아, 이전의 연구에서 B. smithii ET 138의 상동 재조합이 세정 돌연변이체를 얻는데 충분하지 않다는 연구결과를 확인하였다 (Mougiakos et al. ACS Synth. Biol. 6, 849-861 (2017); Bosma et al. Microb. Cell Fact. 14, 99 (2015)). 대조적으로, pThermoCas9_bsΔpyrF1 및 pThermoCas9_bsΔpyrF2 플라스미드로의 형질전환은, 각각, 20 및 0 콜로니를 결과하여, 55℃에서 ThermoCas9의 생체 내 활성을 확인하고, 단백질의 전술된 넓은 시험관 내 온도 범위를 입증한다. 스크린된 10개의 pThermoCas9_ΔpyrF1 콜로니 중에서, 하나는 세정 ΔpyrF 돌연변이체인 반면, 나머지는 혼합된 야생형/ΔpyrF 유전자형을 나타내어 (도 18의 B), 표적화된 pyrF 유전자의 디자인된 상동성 인도 복구 (homology directed repair)이 성공적인 것으로, 시스템의 적용가능성을 증명한다. 그럼에도 불구하고, 우리가 이전에 개발한 엄격히 제어된 SpCas9-계 반대-선택 시스템에서, pyrF 결손 효율은 더 높았다 (Olson et al., Curr. Opin. Biotechnol. 33, 130-141 (2015)). ThermoCas9-계 도구에서 얻어진 형질전환체 및 세정 돌연변이체의 적은 수는, 고도의 활성 ThermoCas9의 구성적 발현과 조합된 B. smithii (Olson et al., Curr. Opin. Biotechnol. 33, 130-141 (2015))에서 낮은 상동 재조합 효율에 의해 설명될 수 있다. 정확히 제어가능한 프로모터의 사용은, 효율을 증가시킬 것으로 예상된다.
실시 예 14: 중온성 슈도모나스 퓨티다에서 ThermoCas9-계 유전자 결손
ThermoCas9-계 게놈 편집 도구의 적용가능성을 넓히고, 및 시험관 내 결과가 생체 내에서 확인될 수 있는지를 평가하기 위해, 중온성 그람-음성 박테리아 P. putida KT2440에서 이의 활성은, 상동 재조합 및 ThermoCas9-계 반대-선택을 조합하여 평가된다. 이 유기체의 경우, Cas9-계 도구는, 현재까지 보고되지 않았다. 한 번 더, 우리는 단일 플라스미드 접근법을 따랐다. 우리는, 3-메틸벤조에이트-유도성 Pm-프로모터의 제어하에 thermocas9 유전자, pyrF 유전자의 결손을 위한 상동 재조합 주형 및 구성적 P3 프로모터의 제어하에 sgRNA 발현 모듈을 함유하는 pEMG-계 pThermoCas9_ppΔpyrF 플라스미드를 구축했다. P. putida KT2440 세포의 형질전환 및 플라스미드 인터그레이션의 PCR 확인 후, 콜로니는, 37℃에서 밤새 배양을 위한 선택적 액체 배지에 접종된다. 오버나이트 배양물 (overnight culture)은, 선택 배지의 접종을 위해 사용하고, ThermoCas9 발현은 3-메틸벤조에이트로 유도된다. 뒤이어, 희석액은 3-메틸벤조에이트가 보충된, 비-선택성 배지 상에 도말된다. 비교를 위해, 3-메틸벤조에이트로 ThermoCas9 발현을 유도하지 않은 병행 실험은 수행된다. 이 과정은, 유도 배양 (induced culture)에 대한 76개의 콜로니 및 비-유도 대조군 배양에 대한 52개의 콜로니를 결과한다. 유도 배양의 경우, 38개의 콜로니 (50%)는, 세정 결손 유전자형을 가지며, 6개의 콜로니는 혼합된 야생-형/결손 유전자형을 갖는다. 반대로, 비-유도 배양의 오직 1개의 콜로니 (2%)는, 결손 유전자형을 가지며, 혼합된 야생-형/결손 유전자형을 가진 콜로니는 검색되지 않았다 (도 24). 이들 결과는, ThermoCas9가, 37℃에서 성장된 경우, 중온성 P. putida KT2440에서 효과적인 반대-선택 도구로 사용될 수 있음을 나타낸다.
실시 예 15: ThermoCas9-계 유전자 침묵
효율적인 열활성 전사적 침묵 CRISPRi 도구는 현재 이용할 수 없다. 이러한 시스템은, 다수의 적용들에서 유용할 수 있다. 예를 들어, 이러한 시스템은, 호열성의 대사 연구를 크게 촉진할 것이다. ThermoCas9의 촉매적으로 죽은 변이체는, dsDNA 절단을 도입하지 않고 DNA 인자에 지속적으로 결합하여 이 목적을 만족시킬 수 있다. 이를 위해, 우리는, ThermoCas9의 RuvC 및 HNH 촉매 도메인을 확인하고, 죽은 (d) ThermoCas9를 생성하기 위해 상응하는 D8A 및 H582A 돌연변이를 도입했다. 디자인된 서열의 확인 후, Thermo-dCas9는, 이종방식으로 생산되며, 정제되고, 전술한 ThermoCas9 분석에서 사용된 것과 동일한 DNA 표적으로 시험관 내 절단 분석을 위해 사용되며; 뉴클레아제의 촉매 비활성화를 확인하는 절단은 관찰되지 않았다.
Thermo-dCas9-계 CRISPRi 도구의 개발을 위해, 우리는 B. smithii ET138의 게놈에서 고도로 발현된 ldhL 유전자의 전사적 침묵을 목표로 했다. 우리는, pNW33n-계 벡터들인, pThermoCas9i_ldhL 및 pThermoCas9i_ctrl을 구축했다. 벡터들 모두는, PxylL 프로모터의 제어하에 thermo-dCas9 유전자 및 구성적 Ppta 프로모터의 제어하에 sgRNA 발현 모듈을 함유한다 (도 18의 C). pThermoCas9i_ldhL 플라스미드는 B. smithii ET 138에서 138 ldhL 유전자의 5' 말단에 비-주형 DNA 가닥을 표적화하기 위한 스페이서를 함유한다. 위치 및 표적화된 가닥 선택은, 이전의 연구 (Bikard et al. Nucleic Acids Res. 41, 7429-7437 (2013), Larson et al. Nat. Protoc. 8, 2180-2196 (2013))에 기초하여, ldhL 유전자의 효율적인 하향-조절 (down-regulation)을 목표로 한다. pThermoCas9i_ctrl 플라스미드는, sgRNA-발현 모듈에 무작위 비-표적화 스페이서를 함유한다. 구축물은, 55℃에서 B. smithii ET 138 수용능 세포를 형질전환시키는데 사용된 다음, LB2 한천 플레이트에 도말하여, 동일한 양의 콜로니를 결과한다. 구축물 당 대략 700개의 콜로니 중에서 2개는, 전술된 바와 같이 (Bosma et al. Appl. Environ. Microbiol. 81, 1874-1883 (2015)), 24시간 동안 미호기성 (microaerobic) 락테이트-생성 조건하에서 배양하기 위해 선택된다. pThermoCas9i_ldhL 배양물의 성장은, pThermoCas9i_ctrl 배양물의 성장보다 50% 적다 (도 18의 D). 우리는, ldhL 유전자의 결손이 미-호기성 조건하에서 Ldh-계 NAD+-재생 능력의 결핍으로 인해 B. smithii ET 138에서 심각한 성장 지연으로 이어진다는 것을 이전에 보여주었다 (Bosma et al. Microb. Cell Fact 14, 99 (2015)). 따라서, 성장에서 관찰된 감소는, ldhL 유전자의 전사적 억제및 뒤이은 NAD+-재생 능력의 상실로 인한 산화환원 불균형 때문일 수 있다. 실제로, HPLC 분석은, ldhL 침묵 배양물의 락테이트 생산에서 40% 감소를 나타냈고, RT-qPCR 분석은, pThermoCas9i_ctrl 배양물과 비교하여 pThermoCas9i_ldhL 배양물에서 ldhL 유전자의 전사 수준이 상당히 감소되었음을 보여준다 (도 18의 D).
실시 예 16: 요약
대부분의 CRISPR-Cas 적용은, Cas9 및 Cas12a와 같은, 부류 2 CRISPR-Cas 단백질에 의한 RNA-가이드된 DNA 간섭에 기초한다 (Komor et al., Cell 168, 20-36 (2017); Puchta, Curr. Opin. Plant Biol. 36, 1-8 (2017); Xu et al. J. Genet. Genomics 42, 141-149 (2015); Tang et al. Nat. Plants 3, 17018 (2017); Zetsche et al. Nat. Biotechnol. 35, 31-34 (2016); Mougiakos et al., Trends Biotechnol. 34, 575-587 (2016)). 이 연구 이전에, 호열성 박테리아 및 고세균에 존재하는 매우 풍부한 부류 1 CRISPR-Cas 시스템과는 달리, 부류 2 CRISPR-Cas 면역 시스템은 호열성 미생물에서 동정 및 특징화되지 않았고 (Makarova et al., Nat. Rev. Microbiol. 13, 722-736 (2015); Weinberger et al., MBio 3, e00456-12 (2012)), 이의 몇몇은, 호열성 미생물의 게놈 편집을 위해 사용되었다 (Li et al. Nucleic Acids Res. 44, e34-e34 (2016)). 결과적으로, CRISPR-Cas 기술의 적용은, 사용된 Cas-엔도뉴클레아제의 중온성 성질에 기인하여, 42℃ 이하의 온도로 주로 제한된다. 그러므로, 이는 상승된 온도 및/또는 개선된 단백질 안정성을 요구하는 절대 호열성 미생물에서 및 실험적 접근법에서 이들 기술의 적용을 배제한다.
본 발명자들은 이전에 퇴비 (compost)에서 단리된 균주인, 호열성 박테리아 G. 써모데니트리피칸스 T12의 Cas9 상동유전자인, ThermoCas9를 특징화하였다 (Daas et al., Biotechnol. Biofuels 9, 210 (2016)). 데이터 마이닝 (Data mining)은, ThermoCas9와 거의 동일한 다른 호열성 미생물의 게놈에 부가적인 Cas9 상동유전자를 보여주는데, 이는 CRISPR-Cas 타입-Ⅱ 시스템이, 호열성 미생물, 적어도 바실러스 (Bacillus) 및 지오바실러스 (Geobacillus) 속의 몇몇 분파 (branches)에 존재하는 것을 처음으로 보여주는 것이다. 본 발명자들은 ThermoCas9가 20-70℃의 넓은 온도 범위에서 시험관 내에서 활성인 것을 알아냈는데, 이는 이의 중온성 상동유전자 SpCas9의 25-44℃ 범위보다 훨씬 더 넓은 것이다. ThermoCas9의 확장된 활성 및 안정성은, 20-70℃의 온도에서 DNA 조작을 필요로 하는 분자 생물학 기술에서 이의 적용뿐만 아니라 강력한 효소 활성을 필요로 하는 가혹한 환경에서 이의 활용을 가능하게 한다. 더군다나, 본 발명자들은, ThermoCas9의 열안정성을 부여하는데 중요한 몇몇 요인들을 확인하였다. 먼저, 본 발명자들은, ThermoCas9의 PAM 선호도가 온도 범위의 하부 (≤30℃)에서 활성에 대해 매우 엄격한 반면, PAM에서 더 많은 다양성이 보통 내지 최적 온도 (37-60℃)에서 활성을 가능하다는 것을 입증하였다. 둘째, 본 발명자들은, ThermoCas9 활성 및 열안정성이 적절한 sgRNA 가이드와의 연관성에 강하게 의존한다는 것을 입증하였다. 어떤 특정 이론에 구속되는 것을 원하지는 않지만, 본 발명자들은, 다중-도메인 Cas9 단백질의 이러한 안정화가, 가이드 결합시 SpCas9에 대해 기재된 바와 같이, 개방/유연한 상태에서 다소 콤팩트한 상태 (compact state)로의 주요 형태 변화 (conformational change)의 결과일 가능성이 크다고 추측한다 (Jinek et al. Science 343, 1247997-1247997 (2014)).
신규 ThermoCas9의 여기서 기재된 특징화에 기초하여, 본 발명자들은 절대 호열성 원핵생물을 위한 게놈 공학 도구를 성공적으로 개발하였다. 우리는, ThermoCas9가 55℃ 및 37℃에서 생체 내 활성인 것을 보여주었으며, 우리는, 호열성 B. smithii ET 138 및 중온성 P. putida KT2440에 대한 현재 Cas9-계 공학 기술을 채택했다. ThermoCas9의 넓은 온도 범위로 인해, 간단하고, 효과적인, 단일 플라스미드-계 ThermoCas9 접근법은 37℃에서 70℃까지의 온도에서 성장할 수 있는 넓은 범위의 호열성 및 중온성 미생물에 대해 적합할 것으로 예상된다. 이것은, 기존의 중온성 기술을 보완하며, 따라서 이러한 효율적인 도구를 지금까지 이용할 수 없었던 많은 유기체의 군에 대해 이들의 사용을 가능하게 한다.
원하는 특성을 지닌 신규 효소에 대한 천연 자원의 스크린은, 의문의 여지없이 가치가 있다. 이전의 연구는, 유도 진화 (directed evolution) 및 단백질 공학과 함께, 더 높은 온도에 중온성 Cas9 상동유전자의 적응이 호열성 Cas9 단백질29의 구축에 대한 최선의 접근법일 것이라고 제안했다. 대신에, 우리는, 몇몇 호열성 박테리아에서 Cas9의 계통 분기 (clade)를 확인했고, 이들 열안정성 ThermoCas9 변이체 중 하나를 호열성 및 중온성 유기체 모두에 대한 강력한 게놈 공학 도구로 잔환시켰다. 이 연구를 통해, 우리는, Cas9-계 게놈 편집 기술의 잠재력을 더욱 넓히고, 가혹한 조건에서 또는 넓은 온도 범위에 걸쳐 활성을 필요로 하는 신규한 적용에서 Cas9 기술을 사용하기 위한 새로운 가능성을 열었다.
실시 예 17: 물질 및 방법
a. 박테리아 균주 및 성장 조건
ThermoCas9를 이용한 유전자 편집 및 침묵 실험을 위해 중간 정도의 호열성 균 B. smithii ET 138 ΔsigF ΔhsdR (Mougiakos, et al., (2017) ACS Synth.Biol.6, 849-861)는 사용된다. 이것은, 55℃에서 LB2 배지 (Bosma, et al. Microb. Cell Fact. 14, 99 (2015))에서 성장된다. 플레이트 (plates)의 경우, 배지 1L 당 30g의 한천 (Difco)은 모든 실험에 사용된다. 필요한 경우, 클로람페니콜은 7㎍/mL의 농도로 첨가된다. 단백질 발현을 위해, E.coli Rosetta (DE3)는, 온도가 16℃로 전환된 후, OD600nm가 0.5에 도달할 때까지 120rpm의 쉐이커 배양기에서 37℃의 플라스크 내의 LB 배지에서 성장된다. 30분 후, 발현은, 이소프로필-1-티오-β-D-갈락토피라노시드 (IPTG)를 0.5mM의 최종 농도로 첨가하여 유도되고, 그 후 배양은 16℃에서 계속된다. 6th 및 7th, 및 8th 위치에 대한 PAM 구축물을 클로닝하기 위해, 제조업자가 제공한 설명서에 따라, DH5-알파 수용능 E. coli (NEB)는 형질전환되고, 37℃에서 LB 한천 플레이트에서 밤새 성장된다. 축퇴 7-nt 길이의 PAM 라이브러리를 클로닝하기 위해, 전기-수용능 DH10B 대장균 세포는, 표준 절차 (Sambrook, Fritsch & Maniatis, T. Molecular cloning: a laboratory manual. (Cold Spring Harbor Laboratory, 1989)에 따라 형질전환되고, 37℃에서 밤새 LB 한천 플레이트 상에서 성장된다. 대장균 DH5α λpir (Invitrogen)는, Ausubel et al.에 기재된 형질전환 절차 (Current Protocols in Molecular Biology. (John Wiley & Sons, Inc., 2001). doi:10.1002/0471142727)를 사용하여 P. putida 플라스미드 구축을 위해 사용된다. 모든 E. coli 균주에 대해, 필요하다면, 클로람페니콜은 25mg/L의 농도로, 카나마이신은 50mg/L로 사용된다. 슈도모나스 퓨티다 KT2440 (DSM 6125) 균주는, 별도로 명시하지 않는 한, LB 배지에서 37℃로 배양된다. 필요한 경우, 카나마이신은 50mg/L의 농도로, 3-메틸벤조에이트는 3 mM의 농도로 첨가된다.
b. ThermoCas9 발현 및 정제
ThermoCas9는 G. 써모데니트리피칸스 T12의 게놈으로부터 PCR 증폭된 다음, E. coli Rosetta (DE3)에서 복제되고, 이종 방식으로 발현되며, Ni2+-친화성, 음이온 교환 및 겔 여과 크로마토그래피 단계들의 조합에 의한 FPLC를 사용하여 정제된다. 유전자는, Tobacco Etch Virus (TEV) 프로테아제절단 부위 및 헥사히스티딘 서열을 포함하는 N-말단 태그와 융합된 ThermoCas9 폴리펩티드 서열 (잔기 1-1082)을 인코딩하는 단백질 발현 구축물을 발생시키기 위해 올리고뉴클레오티드 (표 3)를 사용하여 결찰-독립 클로닝 (ligation-independent cloning)에 의해 (UC Berkeley MacroLab, Addgene #29653으로부터 얻어진) 플라스미드 pML-1B으로 삽입된다. 촉매적으로 비활성인 ThermoCas9 단백질 (Thermo-dCas9)을 발현시키기 위해, D8A 및 H582A 점 돌연변이는, PCR을 사용하여 삽입되고, DNA 시퀀싱으로 확인된다.
본 연구에 사용된 올리고뉴클레오티드.
| |
올리고 |
서열 |
설명 |
SEQ ID |
| PAM 라이브러리 구축 |
BG6494 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC NNNNNNNCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
7-nt 길이의 무작위 PAM 서열을 갖는 체외 표적 DNA의 구축을 위한 FW |
59 |
| BG6495 |
TATGCC GGATCC TCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAG |
체외 표적 DNA 서열의 구축을 위한 RV |
60 |
| BG7356 |
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-T- |
A-tailed ThermoCas9 절단된 단편에 연결하는, BG7357로 어닐링된 경우 어댑터 |
61 |
| BG7357 |
CTGTCTCTTATACACATCTGACGCTGCCGACGA |
A-tailed ThermoCas9 절단된 단편에 연결하는, BG7356으로 어닐링된 경우 어댑터 |
62 |
| BG7358 |
TCGTCGGCAGCGTCAG |
ThermoCas9 절단된 단편의 PCR 증폭을 위한 FW 시퀀싱 아답터 |
63 |
| BG7359 |
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGACCATGATTACGCCAAGC |
ThermoCas9 절단된 단편의 PCR 증폭을 위한 RV 시퀀싱 아답터 |
64 |
| BG7616 |
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGTCATGAGATTATCAAAAAGGATCTTC |
대조군 단편의 PCR 증폭을 위한 RV 시퀀싱 어댑터 |
65 |
| BG8157 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCCAGCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM "CCCCCCAG"로 체외 표적 DNA의 구축을 위한 FW |
66 |
| BG8158 |
TATGCCTCATGAGATTATCAAAAAGGATCTTCAC CCCCCCAACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM "CCCCCCAA"로 체외 표적 DNA의 구축을 위한 FW |
67 |
| BG8159 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCCATCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM "CCCCCCAT"로 체외 표적 DNA의 구축을 위한 FW |
68 |
| BG8160 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM "CCCCCCAC"로 체외 표적 DNA의 구축을 위한 FW |
69 |
| BG8161 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC NNNNTNNCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM "NNNNTNN"로 체외 표적 DNA의 구축을 위한 FW |
70 |
| BG8363 |
ACGGTTATCCACAGAATCAG |
PAM 동정 라이브러리의 PCR 선형화를 위한 FW |
71 |
| BG8364 |
CGGGATTGACTTTTAAAAAAGG |
PAM 동정 라이브러리의 PCR 선형화를 위한 RV |
72 |
| BG8763 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCAAACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "AA"로 체외 표적 DNA의 구축을 위한 FW |
73 |
| BG8764 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCATACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "AT"로 체외 표적 DNA의 구축을 위한 FW |
74 |
| BG8765 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCAGACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "AG"로 체외 표적 DNA의 구축을 위한 FW |
75 |
| BG8766 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCACACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "AC"로 체외 표적 DNA의 구축을 위한 FW |
76 |
| BG8767 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCTAACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "TA"로 체외 표적 DNA의 구축을 위한 FW |
77 |
| BG8768 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCTTACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "TT"로 체외 표적 DNA의 구축을 위한 FW |
78 |
| BG8769 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCTGACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "TG"로 체외 표적 DNA의 구축을 위한 FW |
79 |
| BG8770 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCTCACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "TC"로 체외 표적 DNA의 구축을 위한 FW |
80 |
| BG8771 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCGAACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "GA"로 체외 표적 DNA의 구축을 위한 FW |
81 |
| BG8772 |
TATGCC TCAT GAGATTATCAAAAAGGATCTTCAC CCCCCGTACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "GT"로 체외 표적 DNA의 구축을 위한 FW |
82 |
| BG8773 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCGGACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
FW for construction of in vitro target DNA with PAM 위치 6&7 "GG" |
83 |
| BG8774 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCGCACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "GC"로 체외 표적 DNA의 구축을 위한 FW |
84 |
| BG8775 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCACCCCCCCAACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "CA"로 체외 표적 DNA의 구축을 위한 FW |
85 |
| BG8776 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCCTACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "CT"로 체외 표적 DNA의 구축을 위한 FW |
86 |
| BG8777 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCCGACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "CG"로 체외 표적 DNA의 구축을 위한 FW |
87 |
| BG8778 |
TATGCC TCATGA GATTATCAAAAAGGATCTTCAC CCCCCCCACTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATC |
PAM 위치 6&7 "CC"로 체외 표적 DNA의 구축을 위한 FW |
88 |
| 체외 전사를 위한 gRNA 모듈 |
BG6574 |
AAGCTTGAAATAATACGACTCACTATAGG |
1차 PAM 동정 과정을 위한 sgRNA 주형의 PCR 증폭을 위한 FW (30nt 길이 스페이서) |
89 |
| BG6576 |
AAAAAAGACCTTGACGTTTTCC |
1차 PAM 동정 과정을 위한 sgRNA 주형의 PCR 증폭을 위한 FW |
90 |
| BG9307 |
AAGCTTGAAATAATACGACTCACTATAGGTGAGATTATCAAAAAGGATCTTCACGTC |
1차를 제외한 모든 PAM 동정 과정을 위한 sgRNA 주형의 PCR 증폭을 위한 RV (25nt 길이 스페이서) |
91 |
| BG9309 |
AAAACGCCTAAGAGTGGGGAATG |
1차를 제외한 모든 PAM 동정 과정을 위한 3-헤어핀 길이 sgRNA 주형의 PCR 증폭을 위한 RV |
92 |
| BG9310 |
AAAAGGCGATAGGCGATCC |
1차를 제외한 모든 PAM 동정 과정을 위한 2-헤어핀 길이 sgRNA 주형의 PCR 증폭을 위한 RV |
93 |
| BG9311 |
AAAACGGGTCAGTCTGCCTATAG |
1차를 제외한 모든 PAM 동정 과정을 위한 1-헤어핀 길이 sgRNA 주형의 PCR 증폭을 위한 RV |
94 |
| BG9308 |
AAGCTTGAAATAATACGACTCACTATAGGTGAGATTATCAAAAAGGATCTTCACGTC |
pT7 및 25nt 스페이서 sgRNA Fw |
95 |
| BG10118 |
AAGCTTGAAATAATACGACTCACTATAGGAGATTATCAAAAAGGATCTTCACGTCA |
pT7 및 24nt 스페이서 sgRNA Fw |
96 |
| BG10119 |
AAGCTTGAAATAATACGACTCACTATAGGAAGATTATCAAAAAGGATCTTCACGTCATAG |
pT7 및 23nt 스페이서 sgRNA Fw |
97 |
| BG10120 |
AAGCTTGAAATAATACGACTCACTATAGGATTATCAAAAAGGATCTTCACGTCATAGT |
pT7 및 22nt 스페이서 sgRNA Fw |
98 |
| BG10121 |
AAGCTTGAAATAATACGACTCACTATAGGAATTATCAAAAAGGATCTTCACGTCATAGTT |
pT7 및 21nt 스페이서 sgRNA Fw |
99 |
| BG10122 |
AAGCTTGAAATAATACGACTCACTATAGGTTATCAAAAAGGATCTTCACGTCATAGTT |
pT7 및 20nt 스페이서 sgRNA Fw |
100 |
| BG10123 |
AAGCTTGAAATAATACGACTCACTATAGGTATCAAAAAGGATCTTCACGTCATAGTTC |
pT7 및 19nt 스페이서 sgRNA Fw |
101 |
| BG10124 |
AAGCTTGAAATAATACGACTCACTATAGGATCAAAAAGGATCTTCACGTCATAGTTC |
pT7 및 18nt 스페이서 sgRNA Fw |
102 |
| |
BG9312 |
AAAACGCCTAAGAGTGGGGAATGCCCGAAGAAAGCGGGCGATAGGCGATCC |
3 루프 sgRNA OH Rv |
103 |
| |
BG8191 |
AAGCTTGGCGTAATCATGGTC |
pThermoCas9_ctrl 플라스미드 & pThermoCas9_bsΔyrF1/2의 구축을 위해 |
104 |
| |
BG8192 |
TCATGAGTTCCCATGTTGTG |
pThermoCas9_ctrl 플라스미드 & pThermoCas9_bsΔyrF1/2의 구축을 위해 |
105 |
| 편집 및 침묵 구축 |
BG8194 |
tatggcgaatcacaacatgggaactcatgaGAACATCCTCTTTCTTAG |
pThermoCas9_ctrl 플라스미드 & pThermoCas9_bsΔyrF1/2의 구축을 위해 |
106 |
| BG8195 |
gccgatatcaagaccgattttatacttcatTTAAGTTACCTCCTCGATTG |
pThermoCas9_ctrl 플라스미드 & pThermoCas9_bsΔyrF1/2의 구축을 위해 |
107 |
| BG8196 |
ATGAAGTATAAAATCGGTCTTG |
pThermoCas9_ctrl 플라스미드 & pThermoCas9_bsΔyrF1/2의 구축을 위해 |
108 |
| BG8197 |
TAACGGACGGATAGTTTC |
pThermoCas9_ctrl 플라스미드 & pThermoCas9_bsΔyrF1/2의 구축을 위해 |
109 |
| BG8198 |
gaaagccggggaaactatccgtccgttataAATCAGACAAAATGGCCTGCTTATG |
pThermoCas9_ctrl 플라스미드 & pThermoCas9_bsΔyrF1/2의 구축을 위해 |
110 |
| BG8263 |
gaactatgacactttattttcagaatggacGTATAACGGTATCCATTTTAAGAATAATCC |
pThermoCas9_ctrl 플라스미드의 구축을 위해 |
111 |
| BG8268 |
accgttatacgtccattctgaaaataaagtGTCATAGTTCCCCTGAGAT |
pThermoCas9_ctrl 플라스미드의 구축을 위해 |
112 |
| BG8210 |
aacagctatgaccatgattacgccaagcttCCCTCCCATGCACAATAG |
pThermoCas9_ctrl 플라스미드 & pThermoCas9_bsΔyrF1/2의 구축을 위해 |
113 |
| BG8261 |
gaactatgacatcatggagttttaaatccaGTATAACGGTATCCATTTTAAGAATAATCC |
pThermoCas9_bsΔyrF1의 구축을 위해 |
114 |
| BG8266 |
accgttatactggatttaaaactccatgatGTCATAGTTCCCCTGAGAT |
pThermoCas9_bsΔyrF2의 구축을 위해 |
115 |
| BG8317 |
gaactatgaccacccagcttacatcaacaaGTATAACGGTATCCATTTTAAGAATAATCC |
pThermoCas9_ΔspyrF2의 구축을 위해 |
116 |
| BG8320 |
accgttatacttgttgatgtaagctgggtgGTCATAGTTCCCCTGAGAT |
pThermoCas9_bsΔyrF2의 구축을 위해 |
117 |
| BG9075 |
CTATCGGCATTACGTCTATC |
pThermoCas9i_ctrl의 구축을 위해 |
118 |
| BG9076 |
GCGTCGACTTCTGTATAGC |
pThermoCas9i_ctrl의 구축을 위해 |
119 |
| BG9091 |
TGAAGTATAAAATCGGTCTTGCTATCGGCATTACGTCTATC |
pThermoCas9i_ctrl의 구축을 위해 |
120 |
| BG9092 |
CAAGCTTCGGCTGTATGGAATCACAGCGTCGACTTCTGTATAGC |
pThermoCas9i_ctrl의 구축을 위해 |
121 |
| BG9077 |
GCTGTGATTCCATACAG |
pThermoCas9i_ctrl의 구축을 위해 |
122 |
| BG9267 |
GGTGCAGTAGGTTGCAGCTATGCTTGTATAACGGTATCCAT |
pThermoCas9i_ctrl의 구축을 위해 |
123 |
| BG9263 |
AAGCATAGCTGCAACCTACTGCACCGTCATAGTTCCCCTGAGATTATCG |
pThermoCas9i_ctrl의 구축을 위해 |
124 |
| BG9088 |
TCATGACCAAAATCCCTTAACG |
pThermoCas9i_ctrl의 구축을 위해 |
125 |
| BG9089 |
TTAAGGGATTTTGGTCATGAGAACATCCTCTTTCTTAG |
pThermoCas9i_ctrl의 구축을 위해 |
126 |
| BG9090 |
GCAAGACCGATTTTATACTTCATTTAAG |
pThermoCas9i_ctrl의 구축을 위해 |
127 |
| BG9548 |
GGATCCCATGACGCTAGTATCCAGCTGGGTCATAGTTCCCCTGAGATTATCG |
pThermoCas9i_ldhL의 구축을 위해 |
128 |
| BG9601 |
TTCAATATTTTTTTTGAATAAAAAATACGATACAATAAAAATGTCTAGAAAAAGATAAAAATG |
pThermoCas9i_ldhL의 구축을 위해 |
129 |
| BG9600 |
TTTTTTATTCAAAAAAAATATTGAATTTTAAAAATGATGGTGCTAGTATGAAG |
pThermoCas9i_ldhL의 구축을 위해 |
130 |
| BG9549 |
CCAGCTGGATACTAGCGTCATGGGATCCGTATAACGGTATCCATTTTAAGAATAATCC |
pThermoCas9i_ldhL의 구축을 위해 |
131 |
| BG8552 |
TCGGGGGTTCGTTTCCCTTG |
게놈 pyrF 결손 KO 검사를 검사하기 위한 FW |
132 |
| BG8553 |
CTTACACAGCCAGTGACGGAAC |
게놈 pyrF 결손 KO 검사를 검사하기 위한 RV |
133 |
| |
BG2365 |
GCCGGCGTCCCGGAAAACGA |
pThermoCas9_ppΔpyrF의 구축을 위해 |
134 |
| |
BG2366 |
GCAGGTCGGGTTCCTCGCATCCATGCCCCCGAACT |
pThermoCas9_ppΔpyrF의 구축을 위해 |
135 |
| |
BG2367 |
ggcttcggaatcgttttccgggacgccggcACGGCATTGGCAAGGCCAAG |
pThermoCas9_ppΔpyrF의 구축을 위해 |
136 |
| |
BG2368 |
gacacaggcatcggtGCAGGGTCTCTTGGCAAGTC |
pThermoCas9_ppΔpyrF의 구축을 위해 |
137 |
| |
BG2369 |
gccaagagaccctgCACCGATGCCTGTGTCGAACC |
pThermoCas9_ppΔpyrF의 구축을 위해 |
138 |
| |
BG2370 |
cttggcggaaaacgtcaaggtcttttttacACGCGCATCAACTTCAAGGC |
pThermoCas9_ppΔpyrF의 구축을 위해 |
139 |
| |
BG2371 |
atgacgagctgttcaccagcagcgcTATTATTGAAGCATTTATCAGGG |
pThermoCas9_ppΔpyrF의 구축을 위해 |
140 |
| |
BG2372 |
GTAAAAAAGACCTTGACGTTTTC |
pThermoCas9_ppΔpyrF의 구축을 위해 |
141 |
| |
BG2373 |
tatgaagcgggccatTTGAAGACGAAAGGGCCTC |
pThermoCas9_ppΔpyrF의 구축을 위해 |
142 |
| |
BG2374 |
taatagcgctgctggtgaacagctcGTCATAGTTCCCCTGAGATTATCG |
pThermoCas9_ppΔpyrF의 구축을 위해 |
143 |
| |
BG2375 |
tggagtcatgaacatATGAAGTATAAAATCGGTCTTG |
pThermoCas9_ppΔpyrF의 구축을 위해 |
144 |
| |
BG2376 |
ccctttcgtcttcAAATGGCCCGCTTCATAAGCAG |
pThermoCas9_ppΔpyrF의 구축을 위해 |
145 |
| |
BG2377 |
gattttatacTTCATATGTTCATGACTCCATTATTATTG |
pThermoCas9_ppΔpyrF의 구축을 위해 |
146 |
| |
BG2378 |
gggggcatggatgCGAGGAACCCGACCTGCATTGG |
pThermoCas9_ppΔpyrF의 구축을 위해 |
147 |
| |
BG2381 |
ACACGGCGGATGCACTTACC |
P. putida에서 플라스미드 인터그레이션 및 pyrF 결손을 확인하기 위한 FW |
148 |
| |
BG2382 |
TGGACGTGTACTTCGACAAC |
P. putida에서 pyrF 결손을 확인하기 위한 RV |
149 |
| |
BG2135 |
ACACGGCGGATGCACTTACC |
P. putida에서 플라스미드 인터그레이션 확인을 위한 RV |
150 |
| 시퀀싱 프라이머 |
BG8196 |
TGGACGTGTACTTCGACAAC |
thermocas9 seq. 1 |
151 |
| BG8197 |
TAACGGACGGATAGTTTC |
thermocas9 seq. 2 |
152 |
| BG6850 |
GCCTCATGAATGCAGCGATGGTCCGGTGTTC |
pyrF US |
153 |
| BG6849 |
GCCTCATGAGTTCCCATGTTGTGATTC |
pyrF DS |
154 |
| BG6769 |
CAATCCAACTGGGCTTGAC |
thermocas9 seq. 3 |
155 |
| BG6841 |
CAAGAACTTTATTGGTATAG |
thermocas9 seq. 4 |
156 |
| BG6840 |
TTGCAGAAATGGTTGTCAAG |
thermocas9 seq. 5 |
157 |
| BG9215 |
GAGATAATGCCGACTGTAC |
pNW33n 백본 seq. 1 |
158 |
| BG9216 |
AGGGCTCGCCTTTGGGAAG |
pNW33n 백본 seq. 2 |
159 |
| BG9505 |
GTTGCCAACGTTCTGAG |
thermocas9 seq. 6 |
160 |
| BG9506 |
AATCCACGCCGTTTAG |
thermocas9 seq. 7 |
161 |
| |
|
|
|
|
| 절단 분석 |
BG8363 |
ACGGTTATCCACAGAATCAG |
DNA 표적의 PCR 선형화를 위한 FW |
162 |
| BG8364 |
CGGGATTGACTTTTAAAAAAGG |
DNA 표적의 PCR 선형화를 위한 RV |
163 |
| BG9302 |
AAACTTCATTTTTAATTTAAAAGGATCTAGAACCCCCCGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAA |
ssDNA 절단 분석용 비-주형 가닥 올리고뉴클레오티드 |
164 |
| BG9303 |
TTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCCCCCCAACTAGATCCTTTTAAATTAAAAATGAAGTTT |
ssDNA 절단 분석을 위한 주형 가닥 올리고뉴클레오티드 |
165 |
| BG9304 |
TTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACGGGGGGTTCTAGATCCTTTTAAATTAAAAATGAAGTTT |
ssDNA 절단 분석을 위한 주형 가닥 올리고뉴클레오티드 |
166 |
| ThermoCas9 발현 및 RT-qPCR |
BG7886 |
TACTTCCAATCCAATGCAAAGTATAAAATCGGTCTTGATATCG |
FW LIC_thermocas9 |
167 |
| BG7887 |
TTATCCACTTCCAATGTTATTATAACGGACGGATAGTTTCCCCGGCTTTC |
RV LIC_thermocas9 |
168 |
| ThermoCas9 발현 |
BG9665 |
ATGACGAAAGGAGTTTCTTATTATG |
RV qPCR 체크 ldhl |
169 |
| |
BG9666 |
AACGGTATTCCGTGATTAAG |
FW qPCR 체크 ldhl |
170 |
제한 부위는 이텔리체로 표시된다. PAMs은 밑줄로 표시된다. 스페이서 영역은 굵게 표시된다. 소문자로된 뉴클레오티드는, HiFi DNA Assembly에 대한 프라이머 오버행 (primer overhangs)에 상응한다. LIC: 리가아제독립 클로닝 (Ligase Independent cloning); FW: 포워드 프라이머; RV: 역 프라이머.
단백질은 E. coli Rosetta 2 (DE3) 균주에서 발현된다. 배양물은 0.5-0.6의 OD600nm까지 성장된다. 발현은, IPTG를 0.5mM의 최종 농도로 첨가하여 유도되고, 배양은 16℃에서 밤새 계속된다. 세포는 원심분리에 의해 수확되고, 세포 펠릿은, 프로테아제억제제(Roche cOmplete, EDTA-free) 및 리소자임이 보충된, 20 mL의 용해 버퍼 (Lysis Buffer) (50mM 인산 나트륨 pH 8, 500mM NaCl, 1mM DTT, 10mM 이미다졸)에서 재현탁된다. 균질화 하자마자, 세포는 초음파 MS72 마이크로팁 프로브 (Bandelin)를 사용하고, 5-8분 동안 30% 진폭에서 2초 펄스 및 2.5초 정지로 이루어진, 초음파처리 (Sonoplus, Bandelin)에 의해 용해된 다음, 불용성 물질을 제거하기 위해 1시간 동안 4℃에서 16,000×g로 원심분리된다. 정화된 용해물은, 0.22 미크론 필터 (Mdi 멤브레인 기술)로 여과되고, 니켈 컬럼 (Histrap HP, GE Lifesciences)에 적용되며, 세척한 후, 250 mM 이미다졸로 용출된다. ThermoCas9를 함유하는 분획은, 모아 투석 버퍼 (250mM KCl, 20mM HEPES/ KOH 및 1mM DTT, pH 7.5)로 밤샘 투석된다. 투석 후, 샘플은, 10 mM HEPES/KOH pH 8에서 1:1로 희석되고, IEX-A 버퍼 (150 mM KCl, 20 mM HEPES/KOH pH 8)로 사전-평형화된 헤파린 FF 컬럼에 로딩된다. 컬럼은, IEX-A로 세척되고, 그 다음 IEX-C (2M KCl, 20mM HEPES/KOH pH 8)의 구배 (gradient)로 용출된다. 샘플은, FPLC (AKTA Pure)를 통해 겔 여과 컬럼 (HiLoad 16/600 Superdex 200)에 로딩하기 전에 700㎕로 농축된다. 겔 여과로부터의 분획은 SDS-PAGE에 의해 분석된다; ThermoCas9를 함유하는 분획은 모아, 200㎕ (50mM 인산나트륨 pH 8, 2mM DTT, 5% 글리세롤, 500mM NaCl)로 농축되고, 생화학적 분석을 위해 직접 사용하거나 보관을 위해 -80℃에서 동결된다.
c. sgRNA의 체외 합성
sgRNA 모듈은, 예측된 crRNA 및 tracrRNA 서열을 5'-GAAA-3' 링커와 융합시켜 디자인된다. sgRNA-발현 DNA 서열은, T7 프로모터의 전사적 조절하에 놓는다. 이것은 합성되고 (Baseclear, Leiden, The Netherlands), pUC57 백본에 제공된다. 생화학 반응에 사용된 모든 sgRNA는, HiScribe™ T7 고수율 RNA 합성 키트 (NEB)를 사용하여 합성된다. 5' 말단 상에 T7 서열을 갖는, sgRNA를 코딩하는 PCR 단편은, 체외 전사 반응에서 주형으로 활용된다. T7 전사는, 4시간 동안 수행된다. sgRNA는 실행되고, 우레아-PAGE 겔에서 절제되고, 에탄올 침전을 사용하여 정제된다.
d. 체외 절단 분석
체외 절단 분석은, 정제된 재조합 ThermoCas9로 수행된다. ThermoCas9 단백질, 체외 전사된 sgRNA 및 DNA 기질 (표 3에 기재된 프라이머를 사용하여 PCR 증폭을 사용하여 발생됨)은, 명시된 온도에서 10분 동안 (별도의 언급이 없는 한) 개별적으로 배양된 후, 성분들을 함께 조합하고, 1시간 동안 절단 버퍼 (100mM 인산 나트륨 버퍼 (pH=7), 500mM NaCl, 25mM MgCl2, 25 (V/V%) 글리세롤, 5mM 디티오트레이톨 (DTT))에서 다양한 분석 온도로 이들은 배양한다. 각 절단 반응은, 160 nM의 ThermoCas9 단백질, 4 nM의 기질 DNA, 및 150 nM의 합성된 sgRNA를 함유한다. 반응은, 6x 로딩 염료 (NEB)를 첨가하고, 1.5% 아가로스 겔 상에서 수행하여 중단된다. 겔은 SYBR safe DNA stain (Life Technologies)으로 염색되고, Gel DocTM EZ 겔 이미징 시스템 (Bio-rad)으로 이미지화된다.
e. 체외 PAM 스크린을 위한 라이브러리 구축
PAM 라이브러리의 구축을 위해, 프로토스페이서 및 이의 3' 말단에서 7-bp 길이 축퇴 서열을 함유하는, 122-bp 길이의 DNA 단편은, 프라이머 어닐링 및 Klenow 단편 (exo-) (NEB) 기반 확장에 의해 구축된다. PAM-라이브러리 단편 및 pNW33n 벡터는, BspHI 및 BamHI (NEB)에 의해 소화된 다음, 결찰된다 (T4 리가제, NEB). 결찰 혼합물은 전기-수용능 대장균 DH10B 세포로 형질전환되고, 플라스미드는 액체 배양물로부터 단리된다. 7nt-길이의 PAM 결정 과정의 경우, 플라스미드 라이브러리는, SapI (NEB)에 의해 선형화되고, 표적으로 사용된다. 나머지 분석의 경우, DNA 기질은 PCR 증폭에 의해 선형화된다.
f. PAM 스크리닝 분석
ThermoCas9의 PAM 스크리닝은, (반응 당): 160 nM의 ThermoCas9, 150 nM의 체외 전사된 sgRNA, 4 nM의 DNA 표적, 4㎕의 절단 버퍼 (100 mM 인산 나트륨 버퍼 pH 7.5, 500 mM NaCl, 5 mM DTT, 25% 글리세롤) 및 최대 20㎕의 최종 반응 부피의 MQ 수로 이루어진, 체외 절단 분석을 사용하여 수행된다. 55℃ 반응으로부터 절단 단편을 함유하는 PAM은 겔 정제되고, Illumina 시퀀싱 어댑터로 결찰되며, Illumina HiSeq 2500 시퀀싱 (Baseclear)을 요청한다. 등몰 양의 비-thermoCas9로 처리된 PAM 라이브러리는, 동일한 과정에 적용되고, 참조로서 Illumina HiSeq 2500 시퀀싱을 요청한다. 참조 서열에 완벽한 서열 매칭으로 HiSeq 판독 (HiSeq reads)은 추가 분석을 위해 선택된다. 선택된 판독으로부터, ThermoCas9 처리된 라이브러리에서 1000회 이상 존재하고, 대조군 라이브러리와 비교하여 ThermoCas9 처리된 라이브러리에서 적어도 10배 이상 존재하는 것은, WebLogo 분석 (Crooks et al., Genome Res. 14, 1188-1190 (2004))을 위해 사용된다.
g. B. smithii 및 P. putida에 대한 편집 및 침묵 구축물
플라스미드 구축을 위해 사용된 모든 프라이머 및 플라스미드는, NEBuilder HiFi DNA 어셈블리 (NEB)를 수행하기 위한 적절한 오버행으로 디자인되며, 이들은 표 3 및 표 4에 각각 열거된다. 플라스미드 조립하기 위한 단편은, Q5 Polymerase (NEB) 또는 Phusion Flash High-Fidelity PCR Master Mix (ThermoFisher Scientific)로 PCR을 통해 얻어지고, PCR 생성물은, 1% 아가로즈 겔 전기영동에 적용되며, 그들은 Zymogen gel DNA 회복 키트 (Zymo Research)를 사용하여 정제된다. 조립화된 플라스미드는, P. putida 구축물의 경우에서 화학적 수용능 E. coli DH5α 세포 (NEB), 또는 E. coli DH5α λpir (Invitrogen)로 형질전환되고, 후자는 직접 벡터 인터그레이션을 용이하게 한다. 단일 콜로니는 LB 배지에 접종되고, 플라스미드 물질은, GeneJet 플라스미드 미니프렙 키트 (ThermoFisher Scientific) 및 입증된 서열 (GATC-바이오테크) 및 이전에 기재된 프로토콜 (Bosma, et al. Microb. Cell Fact. 14, 99 (2015))에 따라 제조된, B.smithii ET 138 전기-수용능 세포의 형질전환된 1㎍의 각 구축물을 사용하여 단리된다. Masterpure™ 그램 양성 DNA 정제키트 (Epicentre)는, B. smithii 및 P. putida 액체 배양물로부터 게놈 DNA를 단리를 위해 사용된다.
pThermoCas9_ctrl, pThermoCas9_bsΔpyrF1 및 pThermoCas9_bsΔpyrF2 벡터의 구축을 위해, ΔpyrF 상동 재조합 플랭크와 함께 pNW33n 백본은, pWUR_Cas9sp1_hr 벡터 (Mougiakos, et al. ACS Synth. Biol. 6, 849-861 (2017)) (BG8191 및 BG8192)로부터 PCR 증폭된다. 비변성 PxylA 프로모터는, B. smithii ET 138의 게놈 (BG8194 및 BG8195)으로부터 PCR 증폭된다. thermocas9 유전자는, G. 써모데니트리피칸스 T12의 게놈 (BG8196 및 BG8197)으로부터 PCR 증폭된다. Ppta 프로모터는, pWUR_Cas9sp1_hr 벡터 (Mougiakos, et al., ACS Synth. Biol.6, 849-861 (2017)) (BG8198 및 BG8261_2/BG8263_nc2/BG8317_3)로부터 PCR 증폭된다. sgRNA 스캐폴드가 수반되는 스페이서는, pUC57_T7t12sgRNA 벡터 (BG8266_2/BG8268_nc2/8320_3 및 BG8210)로부터 PCR 증폭된다.
4-단편 어셈블리는, pThermoCas9i_ldhL 벡터의 구축을 위해 디자인되고 실행된다. 처음에, 표적화된 점 돌연변이는, 주형으로 pThermoCas9_ctrl을 사용하는 2-단계 PCR 접근법을 통해, thermocas9 촉매 잔기의 코돈에 도입된다 (돌연변이 D8A 및 H582A). 제1 PCR 단계 (BG9075, BG9076) 동안, 원하는 돌연변이는 생성된 PCR 단편의 말단에 도입되고, 제2 단계 (BG9091, BG9092) 동안, 생성된 단편은, 적절한 어셈블리-오버행 (assembly-overhangs)의 도입을 위한 PCR 주형으로 사용된다. ldhL 침묵 스페이서와 함께 제2 돌연변이 다운스트림에 thermocas9의 부분은, pThermoCas9_ctrl을 주형 (BG9077 및 BG9267)으로 사용하여 PCR 증폭된다. pNW33n 백본과 함께 sgRNA 스캐폴드는, pThermoCas9_ctrl을 주형 (BG9263 및 BG9088)으로 사용하여 PCR 증폭된다. 제1 돌연변이 업스트림에 thermocas9의 부분을 포함하는 프로모터는, pThermoCas9_ctrl을 주형 (BG9089, BG9090)으로 사용하여 PCR 증폭된다.
2-단편 어셈블리는, pThermoCas9i_ctrl 벡터의 구축을 위해 디자인되고, 실행된다. pThermoCas9i_ldhL 벡터에서 스페이서 서열은, 양 말단에서 BaeI 제한 부위를 함유하는 무작위 서열로 대체된다. pNW33n 백본과 함께 sgRNA 스캐폴드는, pThermoCas9_ctrl을 주형 (BG9548, BG9601)으로 사용하여 PCR 증폭된다. 구축물의 다른 절반은, Thermo-dCas9로 이루어지고, 프로모터는, pThermoCas9i_ldhL을 주형 (BG9600, BG9549)으로 사용하여 증폭된다.
5-단편 어셈블리는 P. putida KT2440 벡터 pThermoCas9_ppΔpyrF의 구축을 위해 디자인되고 실행된다. 자살 벡터 (suicide vector) pEMG 유래의 레플리콘 (replicon)은 PCR 증폭된다 (BG2365, BG2366). pyrF의 플랭킹 영역은, KT2440 게놈 DNA (576-bp 업스트림 플랭크에 대해 BG2367, BG2368, 및 540-bp 다운스트림 플랭크에 대해 BG2369, BG2370)로부터 증폭된다. 플랭크는 프라이머들인 BG2368 및 BG2369의 오버랩 (overlaps)을 이용하여 프라이머인 BG2367 및 BG2370을 사용하는 오버랩 확장 PCR (overlap extension PCR)에서 융합된다. sgRNA는 pThermoCas9_ctrl 플라스미드 (BG2371, BG2372)로부터 증폭된다. 구성적 P3 프로모터는, pSW_I-SceI (BG2373, BG2374)로부터 증폭된다. 이 프로모터 단편은, 프라이머인 BG2371 및 BG2374의 오버랩을 이용하여 프라이머인 BG2372 및 BG2373을 사용하는 오버랩 확장 PCR에서 sgRNA 단편에 융합된다. ThermoCas9는, pThermoCas9_ctrl 플라스미드 (BG2375, BG2376)로부터 증폭된다. ThermoCas9의 3-메틸벤조에이트 유도에 사용될, 유도성 Pm-XylS 시스템은, pSW_I-SceI (BG2377, BG2378)로부터 증폭된다.
이 연구에서 사용된 플라스미드
| 플라스미드 |
설명 |
사용된 제한 부위 |
프라이머 |
공급원 |
| pNW33n |
E. coli-Bacillus 셔틀 벡터, 클로닝 벡터, CamR |
- |
- |
BGSC |
| pUC57_T7sgRNAfull |
T7 프로모터의 제어하에 sgRNA를 인코딩하는 DNA를 함유하는 pUC57 벡터; 전체 길이 반복/안티반복 sgRNAs의 체외 전사를 위한 주형으로 역할 |
|
|
Baseclear |
| pMA2_T7sgRNAtruncated R/AR |
T7 프로모터의 제어하에 sgRNA의 절단된 반복/안티반복 부분을 인코딩하는 DNA를 함유하는 벡터; 절단된 반복/안티반복 sgRNA의 체외 전사를 위한 주형으로 역할 |
- |
- |
Gen9 |
| pRARE |
T7 RNA 중합효소 기반 발현 벡터, KanR |
- |
- |
EMD Millipore |
| pML-1B |
희귀한 tRNAs를 인코딩하는, E. coli Rosetta™ (DE3) 플라스미드, CamR |
- |
- |
Macrolab, Addgene |
| pEMG |
KanR 및 레플리콘용 주형으로 사용된, P. putida 자살 벡터 |
|
표 3 참조 |
1 |
| pSW_I-SceI |
xylS 및 P Pm 용 주형으로 사용된, I-SceI를 함유하는 P. putida 벡터 |
|
표 3 참조 |
1 |
| pWUR_Cas9sp1_hr |
pyRF 유전자를 표적으로 하는 spCas9-모듈 함유 스페이서를 갖는 pNW33n. 이 플라스미드는 ThermoCas9 기반 구축물을 구축하기 위한 주형으로 사용됨 |
- |
- |
2
|
| pThermo_Cas9 |
N-말단을 갖는 thermocas9. pML-1에서 BHis-tag 및 TEV 절단 부위. ThermoCas9용 발현 벡터 |
SspI 및 Ligase Independent Cloning |
BG7886 및 BG7887 |
본 연구 |
| pThermo_dCas9 |
N-말단을 갖는 cas9dthermocas9. pML-1에서 His-tag 및 TEV 절단 부위. 촉매적으로 비활성인 (죽은) dThermoCas9용 발현 벡터 |
SspI 및 Ligase Independent Cloning |
BG7886 및 BG7888 |
본 연구 |
| pNW-PAM7nt |
체외 PAM 결정 분석을 위한 7-nt 변성 PAM을 함유하는 pNW33n 벡터에서 표적 서열 |
BamHI 및 BspHI |
표 3 참조 |
본 연구 |
| pNW63-pNW78 |
PAM (CCCCCNNA)의 6th 및 7th 위치에 별개의 뉴클레오티드를 함유하는 pNW33n 벡터에서 표적 서열 |
BamHI 및 BspHI |
표 3 참조 |
본 연구 |
| pThermoCas9_ctrl |
비-표적화 스페이서를 함유하는 ThermoCas9-모듈1을 갖는 pNW33n. 음성 대조군으로 사용됨 |
- |
표 3 참조 |
본 연구 |
| pThermoCas9_bsΔyrF1 |
pyrF 유전자 및 융합된 us+ds pyrF-flanks를 표적화하는 스페이서 1을 함유하는 ThermoCas9-모듈1을 갖는 pNW33n |
- |
표 3 참조 |
본 연구 |
| pThermoCas9_bsΔyrF2 |
pyrF 유전자 및 융합된 us+ds pyrF-flanks를 표적화하는 스페이서 2를 함유하는 ThermoCas9-모듈1을 갖는 pNW33n |
- |
표 3 참조 |
본 연구 |
| pThermoCas9i_ctrl |
비-표적화 스페이서를 함유하는 Thermo-dCas9-모듈2를 갖는 pNW33n. 야생형 대조군으로 사용됨 |
- |
표 3 참조 |
본 연구 |
| pThermoCas9i_ldhL |
ldhL 유전자를 표적화하는 스페이서 2를 함유하는 Thermo-dCas9-모듈2를 갖는 pNW33n |
- |
표 3 참조 |
본 연구 |
| pThermoCas9_ppΔpyrF |
pyrF 유전자 및 융합된 us+ds pyrF-flanks를 표적화하는 스페이서를 함유하는 슈도모나스 퓨티다용 ThermoCas9-module3를 갖는 pEMG |
- |
표 3 참조 |
본 연구 |
1 ThermoCas9 모듈은, 비변성 PxylL 프로모터 하에 thermocas9 다음에, B. coagulans Ppta 프로모터 하에 sgRNA를 함유한다 (도 4). 2 ThermoCas9 모듈과 유사하지만, thermocas9 대신 thermo-dCas9를 이용한다 (도 4).
3 슈도모나스 퓨티다용 ThermoCas9 모듈은, 유도성 Pm-XylS 시스템의 전사 제어하에 thermocas9 다음에, 구성적 P3 프로모터 하에 sgRNA을 함유한다.
h. P. putida를 위한 편집 프로토콜
P. putida로의 플라스미드의 형질전환은 Choi et al. (Choi et al., J. Microbiol. Methods 64, 391-397 (2006))에 따라 수행된다. 성분의 선택 및 형질전환 후에, 오버나이트 배양물은 접종된다. 10㎕의 오버나이트 배양물은 3㎖의 새로운 선별 배지에 접종을 위해 사용되고, 37℃에서 2시간 동안 성장시킨 후, ThermoCas9는 3-메틸벤조에이트로 유도된다. 부가적인 6시간 후, 배양물의 희석액은, 3-메틸벤조에이트가 보충된 비-선택 배지 상에 도말된다. 대조군 배양물의 경우, 모든 단계에서 3-메틸벤조에이트의 첨가는 생략된다. P. putida 염색체에서 플라스미드 인터그레이션의 확인은, 프라이머 BG2381 및 BG2135로 콜로니 PCR에 의해 수행된다. pyrF 결손의 확인은, 프라이머 BG2381 및 BG2382로 콜로니 PCR에 의해 수행된다.
i. RNA 단리
RNA 단리는, 이전에 기재된 프로토콜 (van Hijum et al. BMC Genomics 6, 77 (2005))에 기초한 페놀 추출에 의해 수행된다. 오버나이트 10 mL의 배양물은, 4℃ 및 4816×g에서 15분 동안 원심분리되고, 즉시 RNA 단리를 위해 사용된다. 배지를 제거한 후, 세포는, 0.5 mL의 어름같이 찬 TE 버퍼 (pH 8.0)에 현탁되고, 얼음에서 유지된다. 모든 샘플은, 0.5g의 지르코늄 비드, 30㎕의 10% SDS, 30㎕의 3M 아세트산 나트륨 (pH 5.2), 및 500㎕의 로티-페놀 (Roti-Phenol) (pH 4.5-5.0, Carl Roth GmbH)을 함유하는 2개의 2㎖ 스크류-캡 튜브로 나누어진다. 세포는, FastPrep-24 장치 (MP Biomedicals)를 사용하여 5500rpm에서 45초 동안 파괴되고, 4℃에서 10000rpm으로 5분간 원심분리된다. 각 튜브로부터 400㎕의 수상 (water phase)은, 새로운 튜브로 옮기고, 400㎕의 클로로포름-이소아밀 알코올 (Carl Roth GmbH)을 첨가한 후, 샘플을 4℃ 및 18,400×g로 3분동안 원심분리하였다. 300㎕의 수성 상 (aqueous phase)은, 새로운 튜브로 옮기고, 고순도 RNA 단리 키트 (Roche)로부터의 300㎕의 용해 버퍼와 혼합된다. 뒤이어, 이 키트의 나머지의 절차는, 45분 동안 수행된 DNase 배양 단계를 제외하고, 제조사의 프로토콜에 따라 수행하였다. cDNA의 농도 및 무결성은 Nanodrop-1000 Integrity을 사용하여 결정되고, 단리된 RNA의 농도는 NanoDrop 1000에서 검사된다.
j. RT-qPCR에 의한 mRNA의 정량
1차-가닥 cDNA 합성은, 제조사의 프로토콜에 따라 SuperScript™ III Reverse Transcriptase (Invitrogen)를 사용하여 수행된다. qPCR은 Quanta Biosciences의 iQ 용 PerfeCTa SYBR Green Supermix를 사용하여 수행된다. 40 ng의 각 cDNA 라이브러리는 qPCR용 주형으로 사용된다. 2세트의 프라이머는 사용된다; ldhL 유전자의 150-nt 길이의 영역을 증폭하는 BG9665:BG9666 및 qPCR용 대조군으로서 사용된, rpoD (RNA 폴리머라제시그마 인자) 유전자의 150-nt 길이의 서열을 증폭시키는 BG9889:BG9890. qPCR은 Bio-Rad C1000 Thermal Cycler에서 실행된다.
k. HPLC
락테이트 정량화를 위해 고-압 액체 크로마토그래피 (HPLC) 시스템 ICS-5000은 사용된다. 이 시스템은, Bio-Rad Laboratories의 Aminex HPX 87H 컬럼으로 작동되고, RI-150 40℃의 굴절률 검출기 및 210nm에서 작동하는 UV1000 검출기가 장착된다. 이동 상 (mobile phase)은, 0.16 N H2SO4로 이루어지고, 컬럼은 0.8 mL/min으로 작동된다. 모든 샘플은 0.01N H2SO4에서 10 mM DMSO로 4:1로 희석된다.
실시 예 18: 지오바실러스 써모데니트리피칸스에 thermoCas9의 적용
ThermoCas9는, 55℃에서 지오바실러스 써모데니트리피칸스 (또한 Bacillus thermoglucosidasius, Geobacillus thermoglucosidasius, 및 Parageobacillus thermoglucosidasius로 알려짐)에서 반대 선택 도구로 평가된다. 동일한 플라스미드 상에 thermoCas9 유전자/sgRNA 및 재조합 팔을 이용하는, 단일-플라스미드 접근법은 적용된다. thermoCas9 유전자는, 셀로비오스에 의해 유도될 수 있는 β-글루코시다제 프로모터의 제어하에 놓인다 (Bartosiak-Jentys, J., Hussein, A.H., Lewis, C.J., Leak, D.J. (2013) Microbiology 159:1267-1275). 재조합 효율을 개선하기 위해, 배양 단계는, 플라스미드가 복제할 수 없는, 상승된 온도에서 작업흐름 (workflow)에 부가된다. G. thermoglucosidans DSM 2542T 960bp ldhL 유전자 (NCBI GeneID: 29237966)는, 결손 표적으로 선택된다. 0.9kb의 업스트림 및 다운스트림 단편은, 58℃의 어닐링 온도에서 프라이머 조합 (이하, 표 5 참조): 2420 (5'-AAAACTCACGTTAAGGGATTTTGGTCATGACCGATTCGGCTGTTATGGAGAG-3') [SEQ ID NO: 181] 및 993 (5'-ATTCAAAGTCAGCATCACATCCAATTACATCAAGCAG-3') [SEQ ID NO: 174], 및 992 (5'-TTGGATGTGATGCTGACTTTGAATACAACAAGGTGAAC-3') [SEQ ID NO: 173] 및 2421 (5'-TGCGTCGGAACACCTTCTTCGCGTTTATCGCGGCAAACAGAGCTTTAAAACCAG-3') [SEQ ID NO: 182]을 모두 사용하고, 및 주형으로서 G. thermoglucosidans ΔsigF의 염색체 DNA (국제 (PCT) 출원 공개공보 WO2016/012296호 참조)을 사용하여 PCR에 의해 발생된다. 벡터 백본은, 주형으로서, 실시 예 13에 기재된 바와 같은, pThermoCas9_ctrl을 사용하여 두 부분으로 증폭되어, 비-표적화 스페이서 서열 (5'-TTATGTTTCCGGACATAGTACA-3') [SEQ ID NO: 234]을 도입한다. 하나의 단편은, 프라이머 조합: 2210 (5'-AGGAGGTTGCATATGAAGTATAAAATCGGTCTTG-3') [SEQ ID NO: 178] 및 2490 (5'-ACTCTTATTATATAGAAACGCAACTAAGTTAAGCATTGCCATTATAACGGACGGATAGTTTCCCC-3') [SEQ ID NO: 184]을 사용하여 발생된다.
다른 단편은, 프라이머 조합: 2489 (5'-AACTTAGTTGCGTTTCTATATAATAAGAGTTATGTTTTCCGGACATAGTACAGTCATAGTTCCCCTGAGATTATCG-3') [SEQ ID NO: 183] 및 2401 (5'-TCATGACCAAAATCCCTTAACG-3') [SEQ ID NO: 180]을 사용하여 발생된다. β-글루코시다제 프로모터는, 주형으로서 G. thermoglucosidans ΔsigF (WO2016012296) 염색체 DNA 및 프라이머 조합: 2400 (5'-CGATAAACGCGAAGAAGGTG-3') [SEQ ID NO: 179] 및 2208 (5'-TTTTATACTTCATATGCAACCTCCTTTATGTTC-3') [SEQ ID NO: 177]으로부터 증폭된다.
5개의 PCR 단편은, 제조업자의 설명서에 따라 Phusion Flash High-Fidelity PCR 마스터 믹스 (ThermoFisher)로 생성되고, NEBuilder HiFi DNA Assembly Cloning Kit (New England BioLabs)를 사용하여 오버랩핑 영역 (overlapping regions)을 융합시켜 단일 플라스미드로 조립하여, 비-표적화 플라스미드 pRB061을 결과한다.
플라스미드 DNA는, Zymo DNA 세정 및 농축기 스핀 컬럼 (Zymo Research)을 사용하여 농축되고, 10㎕의 H2O로 용출되며, 전기수용능 E. coli TG90으로 형질전환된다 (Gonzy-Trboul, G., Karmzyn-Campelli, C., Stragier, P. 1992. J. Mol. Biol. 224:967-979). 형질전환체 (Transformants)는, 10mg/L 클로람페니콜이 보충된 LB 아가 플레이트 상에 도말되고, 37℃에서 배양된다. 단일 콜로니는, ZymoPURE™ Plasmid Midiprep Kit (Zymo Research)를 사용하여 플라스미드 추출을 위해 선택된다. 플라스미드 무결성은, 서열 분석에 의해 확인된다.
다운스트림에 인접하여 5'-GGCCCCAA-3'의 PAM 서열을 갖는 게놈 서열에 기초한 표적화 스페이서 (5'-ATAAGGGCAAATGCATAGCTGGC-3') [SEQ ID NO: 235]를 함유하는 플라스미드는, 프라이머 조합: 2501 (5'-AAGAGATAAGGGCAAATGCATAGCTGGCGTCATAGTTCCCCTGAGATTATCG-3') [SEQ ID NO: 185] 및 2125 (5'-TCTTCGATGCGAGGAATGTC-3') [SEQ ID NO: 176] 및 프라이머 조합: 1994 (5'-AAACAAACCACCGCTGGTAG-3') [SEQ ID NO: 175] 및 2502 (5'-ATGACGCCAGCTATGCATTTGCCCTTATCTCTTATTATATAGAAACGCAACTAAG-3') [SEQ ID NO: 186]을 사용하여, 주형으로서 비-표적화 플라스미드 pRB061로 PCR에 의해 증폭된 2개의 단편의 조립에 의해 구축된다.
형질전환 및 플라스미드 추출은, 전술된 바와 같이 수행되어 표적화 플라스미드 pRB063을 결과한다.
플라스미드 pRB061 및 pRB063은, 여기에서 기재된 바와 같은 전기천공법 (WO2016/012296호 참조)에 의해 G. thermoglucosidans ΔsigF (국제 (PCT) 출원 공개공보 WO2016/012296호 참조)로 형질전환되고, 8mg/L 클로람페니콜이 보충된 TGP 플레이트 상에 도말된다. 플레이트는 55℃에서 밤새 배양된다. 단일 콜로니는 선택되고, 8mg/L 클로람페니콜을 보충된 TGP 배양액 (broth)에서 55℃로 밤새 성장된다. 뒤이어, 1㎖는, 8mg/L 클로람페니콜이 보충된 10㎖의 신선한 사전 데워진 TGP 배지로 옮겨진다. 68℃에서 밤새 8시간 동안 배양한 후, 재조합을 일으키기 위해, 1mL는 8mg/L 클로람페니콜 및 1%(w/v) 셀로비오스 (D(+)셀로비오스, 아크로스)가 보충된 10mL의 신선한 사전 데워진 TGP 배지로 이동되어, 베타-글루코시다아제 프로모터를 유도하고, 55℃에서 8시간 동안 배양된다. 배양물은, 1%(w/v) 셀로비오스를 함유하는 TGP 플레이트 상에 55℃에서 도말된다. 콜로니 PCR은 수행되어, 프라이머: 629 (5'-GACTGGGCGCAAGCGGTGATG-3') [SEQ ID NO: 171] 및 630 (5'-CCTGTTGCTGATACAAGGTCTAGC-3') [SEQ ID NO: 172]을 사용하여 ldhL 유전자의 결손을 확인한다. 표적화 스페이서를 함유하는 구축물은, 분석된 36개의 콜로니 중에서 16개의 녹아웃을 결과한다. 무작위 스페이서는, 분석된 78개의 콜로니 중에서 1개의 녹아웃을 결과한다. 이것은 G. thermoglucosidans에서 유전자 결손에 위한 반대-선택 도구의 효율을 입증한다.
| Corbion nr. |
서열 5'-3' |
SEQ ID NO |
| 629 |
GACTGGGCGCAAGCGGTGATG |
171 |
| 630 |
CCTGTTGCTGATACAAGGTCTAGC |
172 |
| 992 |
TTGGATGTGATGCTGACTTTGAATACAACAAGGTGAAC |
173 |
| 993 |
ATTCAAAGTCAGCATCACATCCAATTACATCAAGCAG |
174 |
| 1994 |
AAACAAACCACCGCTGGTAG |
175 |
| 2125 |
TCTTCGATGCGAGGAATGTC |
176 |
| 2208 |
TTTTATACTTCATATGCAACCTCCTTTATGTTC |
177 |
| 2210 |
AGGAGGTTGCATATGAAGTATAAAATCGGTCTTG |
178 |
| 2400 |
CGATAAACGCGAAGAAGGTG |
179 |
| 2401 |
TCATGACCAAAATCCCTTAACG |
180 |
| 2420 |
AAAACTCACGTTAAGGGATTTTGGTCATGACCGATTCGGCTGTTATGGAGAG |
181 |
| 2421 |
TGCGTCGGAACACCTTCTTCGCGTTTATCGCGGCAAACAGAGCTTTAAAACCAG |
182 |
| 2489 |
AACTTAGTTGCGTTTCTATATAATAAGAGTTATGTTTTCCGGACATAGTACAGTCATAGTTCCCCTGAGATTATCG |
183 |
| 2490 |
ACTCTTATTATATAGAAACGCAACTAAGTTAAGCATTGCCATTATAACGGACGGATAGTTTCCCC |
184 |
| 2501 |
aagagATAAGGGCAAATGCATAGCTGGCgtcatagttcccctgagattatcg |
185 |
| 2502 |
atgacGCCAGCTATGCATTTGCCCTTATctcttattatatagaaacgcaactaag |
186 |
실시 예 19
Bacillus coagulans
에서
thermoCas9의 적용
ThermoCas9는, 55℃에서 Bacillus coagulans에 반대 선택 도구로 평가된다. 동일한 플라스미드 상에 thermoCas9 유전자/sgRNA 및 재조합 팔을 이용하는, 단일-플라스미드 접근법은 사용된다. thermoCas9 유전자는, 셀로비오스에 의해 유도될 수 있는 β-글루코시다제 프로모터의 제어하에 놓인다 (Bartosiak-Jentys, J., Hussein, A.H., Lewis, C.J., Leak, D.J. (2013) Microbiology 159:1267-1275). 재조합 효율을 개선하기 위해, 플라스미드가 복제할 수 없는, 상승된 온도에서의 배양 단계는, 작업흐름에 부가된다. B. coagulans DSM 1T 759-bp sigF 유전자 (NCBI GeneID: 29812540)는, 결손 표적으로 선택된다. 0.85 kb의 업스트림 및 다운스트림 단편은, 58℃ 어닐링 온도에서 프라이머 조합 (이하, 표 6 참조): 2561 (5'-TCACGTTAAGGGATTTTGGTCATGAGTGAGTCTGGCTATTGACCTGG-3') [SEQ ID NO: 190] 및 2562 (5'-ATGAAAAAAGCGCACGTCGGCACGACTCCTTAATTG-3') [SEQ ID NO: 191], 및 2563 (5'-ATTAAGGAGTCGTGCCGACGTGCGCTTTTTTCATTCCC-3') [SEQ ID NO: 192] 및 2570 (5'-CACCTTCTTCGCGTTTATCGCGGCACAGGATATAATGGTCGATGTCCTGTTG-3') [SEQ ID NO: 193] 모두를 사용하고, 주형으로서 B. coagulans DSM 1의 염색체 DNA를 사용하여 PCR에 의해 발생된다. 벡터 백본은, 주형으로서 pBR061을 사용하여 두 부분으로 증폭되어, 5'-ATTTCAAA-3의 PAM 서열을 갖는 게놈 서열에 기초한, 표적화 스페이서 서열 5'-CGGGGATATGAACCGGATGACTT-3'[SEQ ID NO: 236]을 도입한다. 하나의 단편은, 프라이머 조합: 2571 (5'-CGATAAACGCGAAGAAGGTG-3') [SEQ ID NO: 194] 및 2579 (5'-AAGTCATCCGGTTCATATCCCCGACTCTTATTATATAGAAACGCAACTAAGTTAAGC-3') [SEQ ID NO: 196]을 사용하여 발생된다.
다른 단편은, 프라이머 조합: 2578 (5'-TAAGAGTCGGGGATATGAACCGGATGACTTGTCATAGTTCCCCTGAGATTATCG-3') [SEQ ID NO: 195] 및 2172 (5'-TCATGACCAAAATCCCTTAAC-3') [SEQ ID NO: 189]을 사용하여 발생된다.
4개의 PCR 단편은, 제조업자의 설명서에 따라 Phusion Flash High-Fidelity PCR 마스터 믹스 (ThermoFisher)로 생성되고, NEBuilder HiFi DNA Assembly Cloning Kit (New England BioLabs)를 사용하여 25-bp 오버랩핑 영역을 융합하여 단일 플라스미드로 조립되어, 표적화 플라스미드 pMH247을 결과한다. 플라스미드 DNA는, Zymo DNA 세정 및 농축기 스핀 컬럼 (Zymo Research)을 사용하여 농축되고, 10㎕의 H2O로 용출되며, 전기수용능 E. coli TG90으로 형질전환된다 (Gonzy-Trboul, G., Karmzyn-Campelli, C., Stragier, P. 1992. J. Mol. Biol. 224:967-979). 형질전환체는, 10mg/L 클로람페니콜이 보충된 LB 아가 플레이트 상에 도말되고, 37℃에서 배양된다. 단일 콜로니는, ZymoPURE™ Plasmid Midiprep Kit (Zymo Research)를 사용하여 플라스미드 추출을 위해 선택된다. 플라스미드 무결성은, 서열 분석에 의해 확인된다. 플라스미드는, 여기에서 기재된 바와 같은 전기천공법에 의해 B. coagulans로 형질전환되고 (Kovacs, A.T., van Hartskamp, M., Kuipers, OP, & van Kranenburg, R. (2010) Applied and Environmental Microbiology, 76 (12), 4085-4088) 및 7mg/L 클로람페니콜이 보충된 BC 플레이트 상에 도말된다 (Kovacs, A. T., van Hartskamp, M., Kuipers, OP, & van Kranenburg, R. (2010) Applied and Environmental Microbiology, 76 12), 4085-4088). 플레이트는 45℃에서 밤새 배양된다. 2개의 단일 콜로니는 선택되고, 7mg/L 클로람페니콜이 보충된 BC 배양액에서 45℃로 밤새 성장된다. 뒤이어, 1㎖는 7mg/L 클로람페니콜이 보충된 10㎖의 신선한, 사전 데워진 BC 배지로 옮겨진다. 65℃에서 4시간 동안 배양 후에, 재조합을 일으키기 위해, 배양물은 55℃에서 4시간 동안 배양된다. 그 후, 1㎖는 7mg/L 클로람페니콜 및 1%(w/v) 셀로비오스가 보충된 10㎖의 신선한, 사전 데워진 BC 배지로 옮겨져, β-글루코시다제 프로모터를 유도하고, 배양물은 55℃에서 밤새 배양된다. 배양물은 1%(w/v) 셀로비오스를 함유하는 BC 한천 플레이트 상에 55℃에서 도말되고, 콜로니 PCR은, 프라이머: 351 (5'-CACCATGTCCCGGACAGCAC-3') [SEQ ID NO: 187] 및 352 (5'-GCGATGAAATTGGAACACTGAC-3') [SEQ ID NO: 188]을 사용하여 녹아웃을 점검하기 위해 수행된다. 하나의 배양물에 대해, 17개의 시험된 콜로니 중 17개는, 2.1 kb의 PCR 단편을 가져서 결손을 확인한다. 다른 배양물에 대해, 18개의 시험된 콜로니 중 15개는, 2.1 kb의 PCR 단편을 가져서 결손을 확인하고, 다른 3개는 야생형의 PCR 단편을 갖는다. 이는 B. coagulans에서 유전자 결손을 위한 반대-선택 도구의 효율성을 입증한다.
| Corbion nr |
서열 5'-3' |
SEQ ID NO |
| 351 |
CACCATGTCCCGGACAGCAC |
187 |
| 352 |
GCGATGAAATTGGAACACTGAC |
188 |
| 2172 |
TCATGACCAAAATCCCTTAAC |
189 |
| 2561 |
TCACGTTAAGGGATTTTGGTCATGAGTGAGTCTGGCTATTGACCTGG |
190 |
| 2562 |
ATGAAAAAAGCGCACGTCGGCACGACTCCTTAATTG |
191 |
| 2563 |
ATTAAGGAGTCGTGCCGACGTGCGCTTTTTTCATTCCC |
192 |
| 2570 |
CACCTTCTTCGCGTTTATCGCGGCACAGGATATAATGGTCGATGTCCTGTTG |
193 |
| 2571 |
CGATAAACGCGAAGAAGGTG |
194 |
| 2578 |
TAAGAGTCGGGGATATGAACCGGATGACTTGTCATAGTTCCCCTGAGATTATCG |
195 |
| 2579 |
AAGTCATCCGGTTCATATCCCCGACTCTTATTATATAGAAACGCAACTAAGTTAAGC |
196 |
실시 예 20: 2-플라스미드 접근법을 사용하여
Pseudomonas putida
에thermoCas9의 적용
ThermoCas9는, 30℃에서 Pseudomonas putida에 반대 선택 도구로서 평가된다. 단일-크로스오버 이벤트 (single-crossover event)를 통해 녹-아웃 벡터를 먼저 인터그레이팅하고, 뒤이어 thermoCas9 유전자를 보유하는 플라스미드 및 표적화 스페이서를 함유하는 sgRNA를 도입하는, 2-단계 접근법은 적용된다. thermoCas9 유전자는, 3-메틸벤조에이트 유도가능한 Pm 프로모터의 제어하에 놓인다. P. putida KT2440, DSM-6125, 702bp 유전자 pyrF (NCBI GeneID: 1043286)는, 실시 예 14에서와 같이, 결손 표적으로 선택된다. 인터그레이션 벡터의 구축을 위해, pyrF의 0.5-kb 업스트림 및 0.5-kb 다운스트림 영역은, 주형으로서 실시 예 14 및 도 25의 pThermoCas9_ppΔpyrF를 사용하여 프라이머 조합 (이하, 표 7 참조): 2461 (5'-GCCGGTAGAACTCCGCGAGGTCGTCCAGCCACGGCATTGGCAAGGCCAAG-3')[SEQ ID NO: 202] 및 2462 (5'-GCGGATAACAATTTCACACAGGAAACAGCTACGCGCATCAACTTCAAGGC-3') [SEQ ID NO: 203]으로 PCR에 의해 증폭된다. 벡터 백본은, 주형으로서 pEMG 자살 벡터 (Martinez-Garcia, E., de Lorenzo, V. (2012) Methods Mol. Biol. 813:267-283)를 사용하여 프라이머 조합: 2459 (5'-AGCTGTTTCCTGTGTGAAATTG-3') [SEQ ID NO: 200] 및 2460 (5'-GGCTGGACGACCTCGCGGAG-3') [SEQ ID NO: 201]을 사용하여 PCR에 의해 증폭된다. 2개의 PCR 단편은, 모든 반응에 대해 58℃ 어닐링 온도를 사용하여, 제조업자의 설명서에 따라 Phusion Flash High-Fidelity PCR 마스터 믹스 (ThermoFisher)로 생성되고, 및 NEBuilder HiFi DNA Assembly Cloning Kit (New England BioLabs)를 사용하여 업스트림 및 다운스트림 영역의 증폭에 사용된 프라이머에 첨가된 벡터 백본 오버랩핑 영역의 융합에 의해 단일 플라스미드로 조립되어, 인터그레이션 플라스미드 pRB051을 결과한다. 플라스미드 DNA는, Zymo DNA 세정 및 농축기 스핀 컬럼 (Zymo Research)을 사용하여 농축되고, 10㎕의 H2O 내로 용리되며, 전기수용능 E. coli DH5α λpir (Invitrogen)로 형질전환된다. 형질전환체는, 50mg/L의 카나마이신이 보충된 LB 한천 플레이트 상에 도말되고, 37℃에서 배양된다. 단일 콜로니는, ZymoPURE™ Plasmid Midiprep Kit (Zymo Research)를 사용하여 플라스미드 추출을 위해 선택된다. 플라스미드 무결성은, 서열 분석에 의해 확인된다. 인터그레이션 플라스미드는, 여기에서 기재된 바와 같은, 전기수용능 P. putida KT2440 세포로 형질전환된다 (Choi, K.H., A Kumar, and H. P. Schweizer. (2006) J. Microbiol. Methods 64:391-397 참조). 형질전환체는, 50mg/L 카나마이신이 보충된 LB 한천 플레이트 상에 도말되고, 30℃에서 배양된다. 단일 콜로니는, MasterPure™ DNA Purification Kit (Epicentre)를 사용하여 단리된, 게놈 DNA의 분석을 위해 선택된다. pyrF의 다운스트림 영역에서 플라스미드 인터그레이션은, 프라이머: 2381(5'-ACACGGCGGATGCACTTACC-3') [SEQ ID NO: 198] 및 2135(5'-CCGCTTTCTTCGGGCATTCC-3') [SEQ ID NO: 197]로 PCR 분석에 의해 확인된다.
ThermoCas9 및 상응하는 sgRNA 인자를 품은 플라스미드에 대하여, 5'-GCCGCCAA-3' PAM 서열이 수반되는 게놈 서열에 기초한 표적화 스페이서 (5'-CCATACCCGCTTTTTCCGCCAGC-3') [SEQ ID NO: 237]는 선택된다. 3-메틸벤조에이트-유도성 Pm-프로모터를 포함하는, 벡터 백본은, 주형으로서 pSW(I-SceI) (Wong, S.M., Mekalanos, J.J. (2000) Proc. Natl. Acad. Sci. USA 97:10191-10196)을 사용하여 프라이머 조합: 2467 (5'-GATTTTATACTTCATATGTTCATGACTCCATTATTATTG-3') [SEQ ID NO: 204] 및 2468 (5'-CAAGGTCTTTTTTACTAAGTCGAGGGGATCCTCTAGC-3') [SEQ ID NO: 205]으로 PCR에 의해 증폭된다. ThermoCas9 및 상응하는 sgRNA 단편은, 주형으로서 pThermoCas9_ppΔyrF을 사용하여 모두에 대해 프라이머 조합: 2469 (5'-CCACACATTATACGAGCCGATGATTAATTGTCAACAGATGGCCCGCTTCATAAGCAG-3') [SEQ ID NO: 206] 및 2470 (5'-TGGAGTCATGAACATATGAAGTATAAAATCGGTCTTG-3') [SEQ ID NO: 207] 및 2471 (5'-GATCCCCTCGACTTAGTAAAAAAGACCTTGACGTTTTC-3') [SEQ ID NO: 208] 및 2742 (5'-GACAATTAATCATCGGCTCGTATAATGTGTGGCCATACCCGCTTTTTCCGCCAGCGTCATAGTTCCCCTGAGATTATCG-3') [SEQ ID NO: 209]으로 PCR에 의해 증폭된다. 3개의 PCR 단편은, 모든 반응에 대해 58℃ 어닐링 온도를 사용하여, 제조업자의 설명서에 따라 Phusion Flash High-Fidelity PCR 마스터 믹스 (ThermoFisher)로 생성되고, NEBuilder HiFi DNA Assembly Cloning Kit (New England BioLabs)를 사용하여, 오버랩핑 영역의 융합에 의해 단일 플라스미드로 조립되어, 플라스미드 pRB054를 결과한다. 플라스미드 DNA는, Zymo DNA 세정 및 농축기 스핀 컬럼 (Zymo Research)을 사용하여 농축되고, 10㎕의 H2O로 용출되며, 열 충격에 의해 대장균 DH5α로 형질전환된다 (Sambrook, J., en DW Russell. (2001) Molecular cloning:a laboratory manual 3rd edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York). 형질전환체는, 150mg/L 암피실린이 보충된 LB 한천 플레이트 상에 도말되고, 30℃에서 배양된다. 단일 콜로니는, ZymoPURE™ Plasmid Midiprep Kit (Zymo Research)를 사용하여 플라스미드 추출을 위해 선택된다. 플라스미드 무결성은 서열 분석에 의해 확인된다.
pRB054 플라스미드는, 확인된 pRB051 인터그레이션으로 전기수용능 P. putida KT2440 세포로 형질전환된다. 형질전환체는, 50mg/L 카나마이신 및 500mg/L 암피실린이 보충된 LB 한천 플레이트에 도말되고, 30℃에서 배양된다. 단일 콜로니는, ZymoPURE™ Plasmid Midiprep Kit (Zymo Research)를 사용하여 플라스미드 추출을 위해 선택된다. 플라스미드 무결성은 서열 분석에 의해 확인된다. 또한, 게놈 DNA는, MasterPure™ DNA Purification Kit (Epicenter)를 사용하여 단리되고, pRB051 인터그레이션은, 프라이머: 2381 (5'-ACACGGCGGATGCACTTACC-3') [SEQ ID NO: 198] 및 2135 (5'-CCGCTTTCTTCGGGCATTCC-3)[SEQ ID NO: 197]로 PCR 분석에 의해 재확인된다. 뒤이어, 표적화 플라스미드를 갖는 균주의 10㎕의 오버나이트 배양물은, 50mg/L 카나마이신 및 500mg/L 암피실린이 보충된 3mL의 LB 배지로 옮겨진다. 30℃에서 2시간 동안 진탕 배양 (shaking incubation) (180r.p.m.)한 후, 3-메틸벤조에이트는, 3mM의 최종 농도로 첨가된다. 배양물은, 30℃에서 부가적인 4시간 동안 진탕, 배양된다. 배양물은, 50mg/L 우라실이 보충된 LB 한천에 도말되고, 30℃에서 배양된다. 밤새 성장 후, 96개 콜로니는, 50mg/L 우라실이 보충된 신선한 LB 한천 플레이트로 옮겨지고, 30℃에서 추가적으로 밤새 배양된다. 콜로니 PCR은, 프라이머: 2381 (5'-ACACGGCGGATGCACTTACC-3') [SEQ ID NO: 198] 및 2382 (5'-TGGACGTGTACTTCGACAAC-3') [SEQ ID NO: 199]를 사용하여 녹아웃을 점검하기 위해 모든 성장된 콜로니에 대해 수행된다. 시험된 48개의 콜로니 중에서, 32개의 콜로니는 PCR 생성물을 산출했다. 32개 모두, 유전자 결손에 상응하는, 1112 bp의 단편을 가졌다. 이들 콜로니 중 하나는 또한 이 콜로니에서 혼합된 야생-형/결손 유전자형을 나타내는 1854 bp의 단편을 제공한다. 이는, 30℃에서 P. putida에 유전자 결손을 위한 반대-선택 도구로서 ThermoCas9의 효율을 입증한다.
| Corbion nr. |
서열 5'-3' |
SEQ ID NO |
| 2135 |
CCGCTTTCTTCGGGCATTCC |
197 |
| 2381 |
ACACGGCGGATGCACTTACC |
198 |
| 2382 |
TGGACGTGTACTTCGACAAC |
199 |
| 2459 |
AGCTGTTTCCTGTGTGAAATTG |
200 |
| 2460 |
GGCTGGACGACCTCGCGGAG |
201 |
| 2461 |
GCCGGTAGAACTCCGCGAGGTCGTCCAGCCACGGCATTGGCAAGGCCAAG |
202 |
| 2462 |
GCGGATAACAATTTCACACAGGAAACAGCTACGCGCATCAACTTCAAGGC |
203 |
| 2467 |
GATTTTATACTTCATATGTTCATGACTCCATTATTATTG |
204 |
| 2468 |
CAAGGTCTTTTTTACTAAGTCGAGGGGATCCTCTAGC |
205 |
| 2469 |
CCACACATTATACGAGCCGATGATTAATTGTCAACAGATGGCCCGCTTCATAAGCAG |
206 |
| 2470 |
TGGAGTCATGAACATATGAAGTATAAAATCGGTCTTG |
207 |
| 2471 |
GATCCCCTCGACTTAGTAAAAAAGACCTTGACGTTTTC |
208 |
| 2742 |
GACAATTAATCATCGGCTCGTATAATGTGTGGCCATACCCGCTTTTTCCGCCAGCGTCATAGTTCCCCTGAGATTATCG |
209 |
실시 예 21:
Saccharomyces cerevisiae
에
ThermoCas9의 적용
ThermoCas9는, 37℃에서 진핵 Saccharomyces cerevisiae에 게놈 편집 도구로서 사용된다. 게놈으로부터 안정한 발현을 위해 ThermoCas9를 먼저 인터그레이션하고, 뒤이어, 선형 이중-가닥 DNA 복구-올리고와 함께 sgRNA를 품은 플라스미드를 도입하는, 2-단계 접근법은 사용된다. ThermoCas9 유전자는, 구성적 TEF1 프로모터, SUP4 터미네이터 및 SNR52 프로모터의 제어하에 sgRNA의 제어하에 놓인다. S. cerevisiae CEN.PK113-17A (Entian KD, Kotter P (1998) Method Microbiol 26:431-449), 1773 bp 유전자 CAN1 (YEL063C; NCBI GeneID: 856646)은, 결손 표적으로서 선택된다.
ThermoCas9 인터그레이션 단편은, 6개의 단편의 어셈블리에 의해 구축된 플라스미드 상에 유지된다. ThermoCas9 단편은, 프라이머 조합 (이하, 표 8 참조): 2119 (5'-AGCAATCTAATCTAAGTTTTAATTACAAAATGAAGTATAAAATCGGTCTTG-3') [SEQ ID NO: 225] 및 2118 (5'-AATGTAAGCGTGACATAACTAATTACATGATTACACCTTCCTCTTCTTCTTGGGTAACGGAC GGATAGTTTCCCCGGCTTTC-3') [SEQ ID NO: 224]으로 증폭되어, 주형으로서 전술된 pThermoCas9_ppΔyrF (실시 예 14 참조)를 사용하여 종결 코돈 (stop codon) 이전에 ThermoCas9의 3' 말단에 융합된 핵 위치 신호 코딩 서열 (5'-CCCAAGAAGAAGAGGAAGGTG-3') [SEQ ID NO: 238]을 도입한다. CYC1 터미네이터는, 주형으로서 pSF-TEF1-URA3 플라스미드 (OGS534; Sigma-Aldrich)를 사용하여 프라이머 조합: 2120 (5'-CCGTTACCCAAGAAGAAGAGGAAGGTGTAATCATGTAATTAGTTATGTCACGCTTAC-3') [SEQ ID NO: 226] 및 2105 (5'-ACAAAATGGAATATGTTCATAGGGTAGACGGATAGAGATGGGCCAATACC-3') [SEQ ID NO: 214]으로 증폭된다. LEU2 유전자좌 (YCL018W, 유전자 ID: 850342)는, 프라이머 조합: 2111 (5'-AACACAGAGTAAATTCCCAAATTATTCCATGTGTTCAAAAACGTTATATTTATAGG-3) [SEQ ID NO: 219] 및 2110 (5'-ATTTAAATTTCCGAACTCTCCAAGGCCCTCAGTCTCGACGATCCATATCG-3') [SEQ ID NO: 218]으로 복구된 LEU2 유전자 (OrganoBalance)를 갖는 S.cerevisiae CEN.PK113-17A의 게놈 DNA로부터 증폭된다.
선택적으로, 유전자는, 유전자의 서열 523 bp 업스트림 및 104 다운스트림을 포함하는 S.cerevisiae S288C LEU2 유전자좌 (YCL018W, 유전자 ID: 850342)에 기초한 합성 DNA로부터 증폭될 수 있다. S. cerevisiae ARS 레플리콘은, 주형으로서 Sapphire™ Technology (GeneArt Cat. No. A13291)로 Vector Conversion Cassette를 사용하여 프라이머 조합: 2104 (5'-TTATCCTATAAATATAACGTTTTTGAACACATGGAATAATTTGGGAATTTACTC-3') [SEQ ID NO: 213] 및 2745 (5'-GGGGACTAAAATTTTTTAATATAAATATATAAATTAAAAATAG-3') [SEQ ID NO: 233]으로 증폭된다. 대장균 pUC 레플리콘은, 주형으로서 pSF-TEF1-URA3 플라스미드 (OGS534; Sigma-Aldrich)를 사용하여 프라이머 조합: 2116 (5'-GCCGATATCAAGACCGATTTTATACTTCATTTTGTAATTAAAACTTAGATTAGATTGCTATGC-3') [SEQ ID NO: 223] 및 2115 (5'-CGCTCATTTGCTCGTCGGGCATCGAATCTCTCTTTGAAAAGATAATGTATGATTATG-3') [SEQ ID NO: 222]으로 증폭된다. 카나마이신 내성 마커 및 TEF1 프로모터를 갖는 단편은, 주형으로서 pSF-TEF1-URA3 플라스미드 (OGS534; Sigma-Aldrich)를 사용하여 프라이머 조합: 2109 (5'-AAGCATAATCATACATTATCTTTTCAAAGAGAGATTCGATGCCCGACGAG-3') [SEQ ID NO: 217] 및 2114 (5'-AATCTCAGGGGAACTATGACTCCACACCTCTGACCAACGCGATCATTTATCTTTCACTGCGGAGAAG-3') [SEQ ID NO: 221]으로 증폭된다. 6개의 PCR 단편은, 제조업자의 설명서에 따라 Phusion Flash High-Fidelity PCR 마스터 믹스 (ThermoFisher)로 생성되고, NEBuilder HiFi DNA Assembly Cloning Kit (New England BioLabs)를 사용하여 오버랩핑 영역을 융합시켜 단일 플라스미드 내로 조립되어, 플라스미드 pRB021를 결과한다. 플라스미드 DNA는, Zymo DNA 세정 및 농축기 스핀 컬럼 (Zymo Research)을 사용하여 농축되고, 10㎕의 H2O 내로 용리되며, 열-충격에 의해 대장균 DH5α λpir로 형질전환된다 (Sambrook, J., en D. W. Russell. 2001. Molecular cloning: a laboratory manual 3rd edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York). 형질전환체는, 50mg/L 카나마이신이 보충된 LB 한천 플레이트 상에 도말되고, 30℃에서 배양된다. 단일 콜로니는, ZymoPURE™ Plasmid Midiprep Kit (Zymo Research)를 사용하여 플라스미드 추출을 위해 선택된다. 플라스미드 무결성은, 서열 분석에 의해 확인된다.
ThermoCas9 유전자는, 주형으로서 pRB021로, TDH1 유전자좌의 업스트림 또는 다운스트림 영역 중 어느 하나에 60 bp 테일 동종성 (tails homologous)을 둘 다 갖는 프라이머 조합: 2580 (5'-TTCTTAGGTGCATGCGACGGTATCCACGTGCAGAACAACATAGTCTGAAGAA GGGGGGGATCCATCTTCGATGGATAGCG-3') [SEQ ID NO: 229] 및 2581 (5'-AGAAGAGAAAAGGGTAAAGTTAATGCTTAATCTTGTCTTGGCTTAAAAAGTAATATGTACGGTCGCCTGACGCATATACC-3') [SEQ ID NO: 230]을 사용한 PCR에 의한 ThermoCas9-LEU2 단편의 증폭에 의해 S. cerevisiae CEN.PK113-17A TDH1 유전자좌 (YJL052W)에 인터그레이팅된다. 증폭된 단편은, Zymo DNA 세정 및 농축기 스핀 컬럼 (Zymo Research)을 사용하여 농축되고, 10㎕의 H2O로 용출된다. 이 단편의 약 500ng은, 여기에서 기재된 바와 같은, 열-충격에 의해 S. cerevisiae CEN.PK113-17A로 형질전환된다 (R. Daniel Gietz, Robin A. Woods, Methods in Enzymology, Academic Press, 2002, Volume 350, Pages 87-96). 형질전환체는, 150mg/L 우라실이 보충된 SM 한천 플레이트 (Verduyn, C., E. Postma, WA Scheffers, and JP van Dijken, 1990, J. Gen. Microbiol. 136:395-403.)상에 도말되고, 3일 동안 30℃로 배양된다. 단일 콜로니는, 제조업체의 프로토콜 II에 따라 YeaStar Genomic DNA Kit (Zymo Research)를 사용하여 게놈 DNA 추출을 위해 선택된다. 단편 인터그레이션 및 ThermoCas9 서열은, 서열 분석에 의해 확인된다.
5'-GAATCCAA-3'의 PAM 서열을 갖는 게놈 서열에 기초하여, 5'-GCACCTGGGTTTCTCCAATAACG-3' [SEQ ID NO: 239]의 표적화 스페이서 서열을 갖는 S. cerevisiae CAN1 표적화 gRNA는, 3개 단편의 조립에 의해 구축된 멀티-카피 플라스미드 (multi-copy plasmid)로부터 발현된다. SNR 프로모터는, 프라이머 조합: 2113 (5'-CTACAAATGTGGTATTGGCCCATCTCTATCCGTCTACCCTATGAACATATTCC-3') [SEQ ID NO: 220] 및 2666 (5'-GGTATAACTTTCATTATACCACAGCGATAATCTCAGGGGAACTATGACCGTTATTGGAGAAACCCAG GTGCGATCATTTATCTTTCACTGCGGAGAAGTTTCGAACGCCGAAACATGCG-3') [SEQ ID NO: 232]으로 S. cerevisiae CEN.PK113-17A 게놈 DNA로부터 증폭된다.
CAN1 표적 스페이서를 포함하는, sgRNA 카세트는, 주형으로서 pThermoCas9_ppΔyrF로 프라이머 조합: 2665 (5'-CGCATGTTTCGGCGTTCGAAACTTCTCCGCAGTGAAAGATAAATGAT CGCACCTGGGTTTCTCCAATAACGGTCATAGTTCCCCTGAGATTATCGCTGTGGTATAATGAAAGTTATACC-3') [SEQ ID NO: 231] 및 2106 (5'-AAAAAACCCCTCAAGACCCGAGACATAAAAAACAAAAAAACGCCTAAGAG TGGGGAATG-3') [SEQ ID NO: 215]을 사용하여 증폭된다. 멀티카피 백본은, 주형으로서 pSF-TEF1-URA3 플라스미드 (OGS534; Sigma-Aldrich)를 사용하여 프라이머 조합: 2103 (5'-GCATTCCCCACTCTTAGGCGTTTTTTTGTTTTTTATGTCTCGGGTCTTGAGGGGTTTTTTGTG-3') [SEQ ID NO: 212] 및 2108 (5'-GCAGTGAAAGATAAATGATCGCGTTGGTCAGAGGTGTGGAGTCATAGTTC CCCTGAGATTATCG-3') [SEQ ID NO: 216]을 사용하여 PCR에 의해 증폭된다. 3개의 PCR 단편은, 제조업자의 설명서에 따라 Phusion Flash High-Fidelity PCR 마스터 믹스 (ThermoFisher)로 생성되고, NEBuilder HiFi DNA Assembly Cloning Kit (New England BioLabs)를 사용하여 오버랩핑 영역을 융합시켜 단일 플라스미드로 조립되어, 멀티-카피 gRNA 보유 플라스미드 pRB089를 결과한다. 플라스미드 DNA는, Zymo DNA 세정 및 농축기 스핀 컬럼 (Zymo Research)을 사용하여 농축되고, 10㎕의 H2O로 용출되며, 열-충격에 의해 대장균 DH5α λpir로 형질전환된다 (Sambrook, J., en DW Russell. 2001. Molecular cloning:a 실험실 매뉴얼 3 판, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York). 형질전환체는, 50mg/L 카나마이신이 보충된 LB 한천 플레이트 상에 도말되고, 30℃에서 배양된다. 단일 콜로니는, ZymoPURE™ Plasmid Midiprep Kit (Zymo Research)를 사용하여 플라스미드 추출을 위해 선택된다. 플라스미드 무결성은, 서열 분석에 의해 확인된다.
CAN1 ORF의 60 bp 업스트림 및 60 bp 다운스트림으로 이루어진 복구-올리고는, 프라이머: 2101 (5'-TTTCAGAGTTCTTCAGACTTCTTAACTCCTGTAAAAACAAAAAAAAAAAAAGGCAT AGCAATATGACGTTTTATTACCTTTAATCACATTCCCACGCCATTTCGCATTCTCACCCTCATA-3') [SEQ ID NO: 210] 및 2102 (5'-TATGAGGGTGAGAATGCGAAATGGCGTGGGAATGTGATTAAAGGTAATAAAACGTCAT ATTGCTATGCCTTTTTTTTTTTTTGTTTTTACAGGAGTTAAGAAGTCTGAAGAACTCTGAAA-3') [SEQ ID NO: 211]를 어닐링하여 구축된다.
10㎕의 100mM 프라이머 모두는 조합되고, 5분 동안 99℃에서 비등되며, 및 뒤이어 실온까지 천천히 냉각하도록 방치한다.
약 100ng의 sgRNA 보유 플라스미드 pRB089는, 모든 단계가 30℃에서 보통 수행되고, 지금 37℃에서 수행되는, 열-쇼크에 의해 S. cerevisiae tdh1::ThermoCas9-LEU2 균주로 200nmol의 어닐링된 CAN1 복구-올리고를 이용하여 공-형질전환된다. 형질전환체는, SM 한천 플레이트 상에 도말되고, 37℃에서 4일간 배양된다. 44개의 콜로니는 떼어 내어, 프라이머: 2223 (5'-GGTTGCGAACAGAGAAACC-3') [SEQ ID NO: 227] 및 2224 (5'-TCGGGAGCAAGATTGTTGTG-3') [SEQ ID NO: 228]로 콜로니 PCR에 의해 분석된다. 이것은, 380 bp 결손 생성물을 갖는 하나의 콜로니를 확인한 반면, 다른 모든 것들은 2153 bp 야생-형 단편을 나타낸다. 이것은, S. cerevisiae에서 ThermoCas9 엔도뉴클레아제 활성 및 게놈 편집에서 이의 사용을 입증한다.
| Corbion nr. |
서열 5'-3' |
SEQ ID NO |
| 2101 |
TTTCAGAGTTCTTCAGACTTCTTAACTCCTGTAAAAACAAAAAAAAAAAAAGGCATAGCAATATGACGTTTTATTACCTTTAATCACATTCCCACGCCATTTCGCATTCTCACCCTCATA |
210 |
| 2102 |
TATGAGGGTGAGAATGCGAAATGGCGTGGGAATGTGATTAAAGGTAATAAAACGTCATATTGCTATGCCTTTTTTTTTTTTTGTTTTTACAGGAGTTAAGAAGTCTGAAGAACTCTGAAA |
211 |
| 2103 |
GCATTCCCCACTCTTAGGCGTTTTTTTGTTTTTTATGTCTCGGGTCTTGAGGGGTTTTTTGTG |
212 |
| 2104 |
TTATCCTATAAATATAACGTTTTTGAACACATGGAATAATTTGGGAATTTACTC |
213 |
| 2105 |
ACAAAATGGAATATGTTCATAGGGTAGACGGATAGAGATGGGCCAATACC |
214 |
| 2106 |
AAAAAACCCCTCAAGACCCGAGACATAAAAAACAAAAAAACGCCTAAGAGTGGGGAATG |
215 |
| 2108 |
GCAGTGAAAGATAAATGATCGCGTTGGTCAGAGGTGTGGAGTCATAGTTCCCCTGAGATTATCG |
216 |
| 2109 |
AAGCATAATCATACATTATCTTTTCAAAGAGAGATTCGATGCCCGACGAG |
217 |
| 2110 |
ATTTAAATTTCCGAACTCTCCAAGGCCCTCAGTCTCGACGATCCATATCG |
218 |
| 2111 |
AACACAGAGTAAATTCCCAAATTATTCCATGTGTTCAAAAACGTTATATTTATAGG |
219 |
| 2113 |
CTACAAATGTGGTATTGGCCCATCTCTATCCGTCTACCCTATGAACATATTCC |
220 |
| 2114 |
AATCTCAGGGGAACTATGACTCCACACCTCTGACCAACGCGATCATTTATCTTTCACTGCGGAGAAG |
221 |
| 2115 |
CGCTCATTTGCTCGTCGGGCATCGAATCTCTCTTTGAAAAGATAATGTATGATTATG |
222 |
| 2116 |
GCCGATATCAAGACCGATTTTATACTTCATTTTGTAATTAAAACTTAGATTAGATTGCTATGC |
223 |
| 2118 |
AATGTAAGCGTGACATAACTAATTACATGATTACACCTTCCTCTTCTTCTTGGGTAACGGACGGATAGTTTCCCCGGCTTTC |
224 |
| 2119 |
AGCAATCTAATCTAAGTTTTAATTACAAAATGAAGTATAAAATCGGTCTTG |
225 |
| 2120 |
CCGTTACCCAAGAAGAAGAGGAAGGTGTAATCATGTAATTAGTTATGTCACGCTTAC |
226 |
| 2223 |
GGTTGCGAACAGAGTAAACC |
227 |
| 2224 |
TCGGGAGCAAGATTGTTGTG |
228 |
| 2580 |
TTCTTAGGTGCATGCGACGGTATCCACGTGCAGAACAACATAGTCTGAAGAAGGGGGGGATCCATCTTCGATGGATAGCG |
229 |
| 2581 |
AGAAGAGAAAAGGGTAAAGTTAATGCTTAATCTTGTCTTGGCTTAAAAAGTAATATGTACGGTCGCCTGACGCATATACC |
230 |
| 2665 |
CGCATGTTTCGGCGTTCGAAACTTCTCCGCAGTGAAAGATAAATGATCGCACCTGGGTTTCTCCAATAACGGTCATAGTTCCCCTGAGATTATCGCTGTGGTATAATGAAAGTTATACC |
231 |
| 2666 |
GGTATAACTTTCATTATACCACAGCGATAATCTCAGGGGAACTATGACCGTTATTGGAGAAACCCAGGTGCGATCATTTATCTTTCACTGCGGAGAAGTTTCGAACGCCGAAACATGCG |
232 |
| 2745 |
GGGGACTAAAATTTTTTAATATAAATATATAAATTAAAAATAG |
233 |
본 상세한 설명의 다음의 섹션은 여기서 이미 기재된 본 발명의 주장을 단순히 제공하는 번호가 매겨진 단락으로 이루어진다. 이 섹션에서 번호가 매겨진 단락은 청구항이 아니다. 청구항은 그 다음 섹션의 "청구 범위"에서 서술된다.
1. 하기를 포함하는 단리된 일정한 간격을 두고 주기적으로 분포하는 짧은 회문구조 반복서열 (CRISPR)-관련 (Cas) 단백질 또는 폴리펩티드:
a. 아미노산 모티프 EKDGKYYC [SEQ ID NO: 2]; 및/또는
b. 아미노산 모티프 X1X2CTX3X4 [SEQ ID NO: 3], 여기서, X1은 이소류신, 메티오닌 또는 프롤린으로부터 독립적으로 선택되고, X2는 발린, 세린, 아스파라긴 또는 이소류신으로부터 독립적으로 선택되며, X3는 글루타메이트 또는 리신으로부터 독립적으로 선택되고, 및 X4는 알라닌, 글루타메이트 또는 아르기닌 중 하나임; 및/또는
c. 아미노산 모티프 X5LKX6IE [SEQ ID NO: 4], 여기서, X5는 메티오닌 또는 페닐알라닌으로부터 독립적으로 선택되고, 및 X6는 히스티딘 또는 아스파라긴으로부터 독립적으로 선택됨; 및/또는
d. 아미노산 모티프 X7VYSX8K [SEQ ID NO: 5], 여기서, X7은 글루타메이트 또는 이소류신이고, X8은 트립토판, 세린 또는 리신 중 하나임; 및/또는
e. 아미노산 모티프 X9FYX10X11REQX12KEX13 [SEQ ID NO: 6], 여기서, X9은 알라닌 또는 글루타메이트이고, X10은 글루타민 또는 라신이며, X11은 아르기닌 또는 알라닌이고, X12는 아스파라긴 또는 알라닌이며, X13은 리신 또는 세린이고;
여기서, Cas 단백질은, 적어도 하나의 표적화 RNA 분자, 및 상기 표적화 RNA 분자에 의해 인지된 표적 핵산 서열을 포함하는 폴리뉴클레오티드와 결합하는 경우, 50℃ 내지 100℃에서 DNA 절단을 할 수 있다.
2. SEQ ID NO: 1의 아미노산 서열 또는 이와 적어도 77% 동일성의 서열을 갖는 단리된 Cas 단백질 또는 이의 폴리펩티드 단편, 여기서, 상기 Cas 단백질은, 표적 서열을 인지하는 적어도 하나의 RNA 분자와 결합하는 경우, 50℃ 내지 100℃의 온도에서 표적 핵산 서열을 포함하는 폴리뉴클레오티드를 결합, 절단, 변형 또는 표지를 할 수 있다.
3. 단락 번호 1 또는 2의 Cas 단백질 또는 폴리펩티드 단편에서, 상기 Cas 단백질 또는 폴리펩티드 단편은, 50℃ 내지 70℃ 범위의 온도, 바람직하게는, 60℃ 이상의 온도; 좀 더 바람직하게는, 60℃ 내지 80℃의 온도; 더욱 더 바람직하게는, 60℃ 내지 65℃의 온도에서 핵산 절단, 결합, 표지 또는 변형시킬 수 있다.
4. 전술된 단락 번호 1 내지 3 중 어느 하나의 Cas 단백질 또는 폴리펩티드 단편에서, 상기 핵산 결합, 절단, 표지 또는 변형은 DNA 절단이다.
5. 전술된 단락 번호 중 어느 하나의 Cas 단백질 또는 폴리펩티드 단편에서, 상기 아미노산 서열은, SEQ ID NO: 1의 아미노산 서열 또는 이와 적어도 77% 동일성의 서열을 포함한다.
6. 전술된 단락 번호 중 어느 하나의 Cas 단백질 또는 폴리펩티드 단편에서, 상기 Cas 단백질은 박테리아, 고세균 또는 바이러스로부터 얻을 수 있다.
7. 전술된 단락 번호 중 어느 하나의 Cas 단백질 또는 폴리펩티드 단편에서, 상기 Cas 단백질은 지오바실러스 속, 바람직하게는, 지오바실러스 써모데니트리피칸스로부터 얻을 수 있다.
8. 전술된 단락 번호 중 어느 하나의 Cas 단백질을 포함하고, 및 표적 폴리뉴클레오티드에서 서열을 인식하는 적어도 하나의 표적화 RNA 분자를 포함하는 리보핵산 단백질 복합체.
9. 단락 번호 8의 리보핵산 단백질 복합체에서, 상기 표적화 RNA 분자는 crRNA 및 선택적으로 tracrRNA를 포함한다.
10. 단락 번호 8 내지 9 중 어느 하나의 리보핵산 단백질 복합체에서, 상기 적어도 하나의 RNA 분자의 길이는 35-135 뉴클레오티드 잔기의 범위이다.
11. 단락 번호 8 내지 9 중 어느 하나의 리보핵산 단백질 복합체에서, 상기 표적 서열은 길이가 31 또는 32 뉴클레오티드 잔기이다.
12. 단락 번호 1 내지 7 중 어느 하나의 Cas 단백질 또는 폴리펩티드에서, 또는 단락 번호 8 내지 11 중 어느 하나의 리보핵산 단백질 복합체에서, 상기 단백질 또는 폴리펩티드는, 적어도 하나의 추가의 기능성 또는 비-기능성 단백질을 포함하는 단백질 복합체의 일부로서 제공된다.
13. 단락 번호 12의 Cas 단백질, 폴리펩티드, 또는 리보핵산 단백질 복합체에서, 상기 Cas 단백질 또는 폴리펩티드는, 및/또는 적어도 하나의 추가의 단백질은, 적어도 하나의 기능성 모이어티를 더욱 포함한다.
14. 단락 번호 13의 Cas 단백질, 폴리펩티드, 또는 리보핵산 단백질 복합체에서, 상기 적어도 하나의 기능성 모이어티는, Cas 단백질, 폴리펩티드, 또는 리보핵산 단백질 복합체의 N-말단 및/또는 C-말단; 바람직하게는, N-말단에 융합 또는 연결된다.
15. 단락 번호 13 또는 14의 Cas 단백질, 폴리펩티드, 또는 리보핵산 단백질 복합체에서, 상기 적어도 하나의 기능성 모이어티는: 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라제, 포스파타아제, 키나아제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치정보 서열, 항체 에피토프 또는 친화성 정제태그로부터 선택적으로 선택된 단백질이다.
16. 단락 번호 15의 Cas 단백질 또는 폴리펩티드, 또는 리보핵산 단백질 복합체에서, 상기 Cas9 뉴클레아제활성의 고유 활성은 비활성화되고, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티에 연결된다.
17. 단락 번호 15 또는 16의 Cas 단백질 또는 폴리펩티드, 또는 리보핵산 단백질 복합체에서, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제도메인; 바람직하게는, FokI 뉴클레아제도메인이다.
18. 단락 번호 15 내지 17 중 어느 하나의 Cas 단백질 또는 폴리펩티드, 또는 리보핵산 단백질 복합체에서, 상기 적어도 하나의 기능성 모이어티는 마커 단백질, 예를 들어, GFP이다.
19. Cas 단백질 또는 폴리펩티드를 인코딩하는 단리된 핵산 분자로서, 상기 단리된 핵산 분자는:
a. 아미노산 모티프 EKDGKYYC [SEQ ID NO: 2]; 및/또는
b. 아미노산 모티프 X1X2CTX3X4 [SEQ ID NO: 3], 여기서, X1은 이소류신, 메티오닌 또는 프롤린으로부터 독립적으로 선택되고, X2는 발린, 세린, 아스파라긴 또는 이소류신으로부터 독립적으로 선택되며, X3는 글루타메이트 또는 리신으로부터 독립적으로 선택되고, 및 X4는 알라닌, 글루타메이트 또는 아르기닌 중 하나임; 및/또는
c. 아미노산 모티프 X5LKX6IE [SEQ ID NO: 4], 여기서, X5는 메티오닌 또는 페닐알라닌으로부터 독립적으로 선택되고, 및 X6는 히스티딘 또는 아스파라긴으로부터 독립적으로 선택됨; 및/또는
d. 아미노산 모티프 X7VYSX8K [SEQ ID NO: 5], 여기서, X7은 글루타메이트 또는 이소류신이고, X8은 트립토판, 세린 또는 리신 중 하나임; 및/또는
e. 아미노산 모티프 X9FYX10X11REQX12KEX13 [SEQ ID NO: 6]을 포함하며, 여기서, X9은 알라닌 또는 글루타메이트이고, X10은 글루타민 또는 라신이며, X11은 아르기닌 또는 알라닌이고, X12는 아스파라긴 또는 알라닌이며, X13은 리신 또는 세린이고;
여기서, Cas 단백질 또는 폴리펩티드는, 적어도 하나의 표적화 RNA 분자, 및 상기 표적화 RNA 분자에 의해 인지된 표적 핵산 서열을 포함하는 폴리뉴클레오티드와 결합하는 경우, 50℃ 내지 100℃에서 DNA 결합, 절단, 표지 또는 변형시킬 수 있다.
20. SEQ ID NO: 1의 아미노산 서열 또는 이와 적어도 77% 동일성의 서열을 갖는 일정한 간격을 두고 주기적으로 분포하는 짧은 회문구조 반복서열 (CRISPR)-관련 (Cas) 단백질; 또는 이의 폴리페티드 단편을 인코딩하는 단리된 핵산 분자.
21. 단락 번호 19 또는 20의 단리된 핵산 분자에서, 번역시에 Cas 단백질 또는 폴리펩티드와 융합되는 아미노산 서열을 인코딩하는 적어도 하나의 핵산 서열을 더욱 포함한다.
22. 단락 번호 21의 단리된 핵산 분자에서, 상기 Cas 단백질 또는 폴리펩티드를 인코딩하는 핵산 분자에 융합된 적어도 하나의 핵산 서열은, 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라제, 포스파타아제, 키나아제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치정보 서열, 항체 에피토프 또는 친화성 정제태그로부터 선택된 단백질을 인코딩한다.
23. 단락 번호 19 내지 22 중 어느 하나의 핵산 분자를 포함하는 발현 벡터.
24. 단락 번호 23의 발현 벡터에서, 적어도 하나의 표적화 RNA 분자를 인코딩하는 뉴클레오티드 서열을 더욱 포함한다.
25. 하기와 핵산을 접촉시키는 단계를 포함하는, 표적 핵산을 변형시키는 방법:
a. 단락 번호 6 내지 11 중 어느 하나의 리보핵산 단백질 복합체; 또는
b. 단락 번호 12 내지 18 중 어느 하나의 단백질 또는 단백질 복합체 및 단락 번호 6 내지 11 중 어느 하나에서 정의된 바와 같은 적어도 하나의 표적화 RNA 분자; 및 여기서 상기 방법은 인간 세포에서 사용되지 않는다.
26. 단락 번호 24의 발현 벡터로 세포를 형질전환, 형질감염 또는 형질도입하는 단계; 또는 선택적으로 단락 번호 23의 발현 벡터 및 단락 번호 6 내지 11 중 어느 하나에 정의된 바와 같은 표적화 RNA 분자를 인코딩하는 뉴클레오티드 서열을 포함하는 추가의 발현 벡터로 세포를 형질전환, 형질감염 또는 형질도입하는 단계를 포함하는, 비-인간 세포에서 표적 핵산을 변형시키는 방법.
27. 단락 번호 23의 발현 벡터로 세포를 형질전환, 형질감염 또는 형질도입하는 단계, 및 그 다음 단락 번호 6 내지 11 중 어느 하나에 정의된 바와 같은 표적화 RNA 분자를 세포에 또는 세포 내로 전달하는 단계를 포함하는, 비-인간 세포에서 표적 핵산을 변형시키는 방법.
28. 단락 번호 25 내지 28 중 어느 한 항의 표적 핵산을 변형시키는 방법에서, 상기 적어도 하나의 기능성 모이어티는, 마커 단백질 또는 리포터 단백질이고, 상기 마커 단백질 또는 리포터 단백질은 표적 핵산과 결합하고; 바람직하게는 상기 마커는 형광 단백질, 예를 들어, 녹색 형광 단백질 (GFP)이다.
29. 단락 번호 25 내지 28 중 어느 한 항의 표적 핵산을 변형시키는 방법에서, 상기 표적 핵산은 DNA; 바람직하게는 dsDNA이다.
30. 단락 번호 25 내지 28 중 어느 한 항의 표적 핵산을 변형시키는 방법에서, 상기 표적 핵산은 RNA이다.
31. 단락 번호 29의 표적 핵산을 변형시키는 방법에서, 상기 핵산은 dsDNA이고, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제또는 헬리카제-뉴클레아제이며, 및 상기 변형은 원하는 유전자좌에서 단일-가닥 또는 이중-가닥 절단이다.
32. 단락 번호 26, 27, 29 또는 31 중 어느 하나의 방법 중 어느 하나에 따라 원하는 유전자좌에서 유전자 발현을 침묵시키는 방법.
33. 단락 번호 26, 27, 29 또는 31 중 어느 하나의 방법 중 어느 하나에 따라 원하는 위치에 원하는 뉴클레오티드 서열을 변형 또는 결손 및/또는 삽입하는 방법.
34. 단락 번호 25 내지 29 중 어느 하나의 방법에서와 같이 표적 핵산 서열을 변형시키는 단계를 포함하는, 비-인간 세포에서 유전자 발현을 변형시키는 방법에서, 상기 핵산은 dsDNA이고, 상기 기능성 모이어티는 DNA 변형 효소 (예를 들어, 메틸라아제또는 아세틸라제), 전사 활성인자 또는 전사 억제인자로부터 선택된다.
35. 단락 번호 30의 방법에서와 같이 표적 핵산 서열을 변형시키는 단계를 포함하는, 비-인간 세포에서 유전자 발현을 변형시키는 방법에서, 상기 핵산은 mRNA이고, 상기 기능성 모이어티는 리보뉴클레아제이며; 선택적으로 엔도뉴클레아제, 3' 엑소뉴클레아제또는 5' 엑소뉴클레아제로부터 선택된다.
36. 단락 번호 25 내지 35 중 어느 하나에서와 같이 표적 핵산을 변형시키는 방법에서, 상기 방법은, 50℃ 내지 100℃의 온도에서 수행된다.
37. 단락 번호 36에서와 같이 표적 핵산을 변형시키는 방법에서, 상기 방법은, 60℃ 이상, 바람직하게는 60℃ 내지80℃, 보다 바람직하게는 60℃ 내지 65℃의 온도에서 수행된다.
38. 단락 번호 25 내지 37 중 어느 하나의 방법에서, 상기 세포는 원핵세포이다.
39. 단락 번호 25 내지 38 중 어느 하나의 방법에서, 상기 세포는 진핵세포이다.
40. 단락 번호 22 내지 36 중 어느 하나의 방법에 의해 형질전환된 숙주 세포로서; 여기서 상기 세포는 인간 세포가 아니다.
본 상세한 설명의 다음의 섹션은 여기서 이미 기재된 본 발명의 주장을 단순히 제공하는 번호가 매겨진 단락으로 이루어진다. 이 섹션에서 번호가 매겨진 단락은 청구항이 아니다. 청구항은 그 다음 섹션의 "청구 범위"에서 서술된다.
1. 표적 핵산 서열을 포함하는 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키기 위한 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법으로서, 여기서:
상기 이중 가닥 표적 폴리뉴클레오티드는, 상기 표적 핵산 서열을 포함하는, 표적 핵산 가닥, 및 상기 표적 핵산 서열에 상보적인 프로토스페이스 핵산 서열을 포함하는, 비-표적 핵산 가닥을 포함하고;
상기 Cas 단백질은, SEQ ID NO: 1의 아미노산 서열 또는 이와 적어도 77% 동일성의 서열을 가지며;
상기 적어도 하나의 표적화 RNA 분자는 표적 서열을 인식하고;
상기 비-표적 핵산 가닥은, 프로토스페이서 핵산 서열의 3' 말단에 바로 인접한 프로토스페이서 인근 모티프 (PAM) 서열을 더욱 포함하며, 여기서, 상기 PAM 서열은 5'-NNNNCNN-3'을 포함하고; 및 상기 사용은 인간 세포에서가 아닌, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
2. 단략 1에 있어서, 상기 결합, 절단, 표지 또는 변형은, 20℃ 내지 100℃의 온도, 30℃ 내지 80℃의 온도, 37℃ 내지 78℃의 온도, 바람직하게는, 55℃ 이상의 온도; 보다 바람직하게는, 55℃ 내지 80℃의 온도에서; 더욱 바람직하게는, 55℃ 내지 65℃ 또는 60℃ 내지 65℃의 온도에서 발생하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
3. 단락 1 또는 2에 있어서, 상기 표적 핵산 서열을 포함하는 폴리뉴클레오티드는, Cas 단백질에 의해 절단되고, 바람직하게는, 상기 절단은 DNA 절단인, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
4. 단락 1 내지 3 중 어느 하나에 있어서, 상기 표적 서열을 포함하는 표적 핵산 가닥은, 이중 가닥 DNA이고, 상기 사용은 표적 핵산 서열을 포함하는 폴리뉴클레오티드에서 이중 가닥 절단을 결과하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
5. 단락 1 또는 2에 있어서, 상기 표적 핵산 서열을 포함하는 폴리뉴클레오티드는 이중 가닥 DNA이고, 상기 Cas 단백질은 이중 가닥 DNA를 절단하는 능력이 없으며, 상기 사용은 폴리뉴클레오티드의 유전자 침묵을 결과하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
6. 단락 5에 있어서, 상기 Cas 단백질을 포함하는 폴리뉴클레오티드는, 돌연변이 D8A 및 H582A를 함유하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
7. 전술한 단락 중 어느 하나에 있어서,
상기 PAM 서열은, 5'-NNNNCNNA-3' [SEQ ID NO: 47]을 포함하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
8. 전술한 단락 중 어느 하나에 있어서, 상기 PAM 서열은, 5'-NNNNCSAA-3' [SEQ ID NO: 48]을 포함하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
9. 단락 8에 있어서, 상기 PAM 서열은, 5'-NNNNCCAA-3' [SEQ ID NO: 50]을 포함하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
10. 단락 8 또는 9에 있어서, 상기 결합, 절단, 표지 또는 변형은, 20℃ 내지 70℃의 온도에서 발생하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
11. 단락 7 내지 10 중 어느 하나에 있어서, 상기 결합, 절단, 표지 또는 변형은, 25℃ 내지 65℃의 온도에서 발생하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
12. 전술한 단락 중 어느 하나에 있어서, 상기 Cas 단백질은, 박테리아, 고세균 또는 바이러스, 바람직하게는, 호열성 박테리아로부터 얻을 수 있는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
13. 전술한 단락 중 어느 하나에 있어서, 상기 Cas 단백질은 지오바실러스 속, 바람직하게는, 지오바실러스 써모데니트리피칸스로부터 얻을 수 있는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
14. 전술한 단락 중 어느 하나에 있어서, 상기 표적화 RNA 분자는 crRNA 및 tracrRNA를 포함하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
15. 전술한 단락 중 어느 하나에 있어서, 상기 적어도 하나의 표적화 RNA 분자의 길이는 35-200 뉴클레오티드 잔기의 범위인, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
16. 전술한 단락 중 어느 하나에 있어서, 상기 표적 핵산 서열은 길이가 15 내지 32 뉴클레오티드 잔기인, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
17. 전술한 단락 중 어느 하나에 있어서, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티를 더욱 포함하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
18. 전술한 단락 중 어느 하나에 있어서, 상기 Cas 단백질은, 적어도 하나의 추가의 기능성 또는 비-기능성 단백질을 포함하는 단백질 복합체의 일부로서 제공되고, 선택적으로, 상기 적어도 하나의 추가의 단백질은 적어도 하나의 기능성 모이어티를 더욱 포함하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
19. 단락 17 또는 18에 있어서, 상기 Cas 단백질 또는 추가의 단백질은, Cas 단백질 또는 단백질 복합체의 N-말단 및/또는 C-말단; 바람직하게는, C-말단에 융합 또는 연결된 적어도 하나의 기능성 모이어티를 포함하는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
20.단락 17 내지 19 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는: 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라제, 포스파타아제, 키나아제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치정보 서열, 항체 에피토프 또는 친화성 정제태그, 예를 들어, 녹색 형광 단백질 (GFP)로부터 선택적으로 선택된 단백질인, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
21. 단락 20에 있어서, 상기 Cas9 뉴클레아제의 고유 활성은 비활성화되고, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티에 연결되는, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
22. 단락 20 또는 21에 있어서, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제도메인; 바람직하게는, FokI 뉴클레아제도메인인, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
23. 단락 20 내지 22 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는 마커 단백질인, 적어도 하나의 표적화 RNA 분자 및 Cas 단백질의 사용 방법.
24. 표적 핵산 서열을 포함하는 표적 핵산 가닥, 및 상기 표적 핵산 서열에 상보적인 프로토스페이스 핵산 서열을 포함하는 비-표적 핵산 가닥을 포함하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법으로서, 상기 방법은:
a. 적어도 하나의 표적화 RNA 분자를 디자인하는 단계로서, 여기서, 상기 표적화 RNA 분자는 표적 가닥에서 표적 서열을 인식하고, 상기 비-표적 가닥은, 프로토스페이서 핵산 서열의 3' 말단에 바로 인접한 프로토스페이서 인근 모티프 (PAM) 서열을 더욱 포함하며, 여기서, 상기 PAM 서열은 5'-NNNNCNN-3'을 포함하는, 디자인 단계;
b. 상기 표적화 RNA 분자 및 Cas 단백질을 포함하는 리보핵산 단백질 복합체를 형성하는 단계로서, 여기서, 단리된 Cas 단백질은 SEQ ID NO: 1의 아미노산 서열 또는 이와 적어도 77% 동일성의 서열을 갖는, 형성 단계; 및
c. 상기 리보핵산 단백질 복합체를 사용하여 상기 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 단계를 포함하며, 여기서, 상기 방법은 사람 세포에 사용되지 않는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
25. 단락 24에 있어서, 상기 결합, 절단, 표지 또는 변형은, 20℃ 내지 100℃의 온도, 30℃ 내지 80℃의 온도, 37℃ 내지 78℃의 온도, 바람직하게는, 55℃ 이상의 온도; 보다 바람직하게는, 55℃ 내지 80℃의 온도에서; 더욱 바람직하게는, 55℃ 내지 65℃ 또는 60℃ 내지 65℃의 온도에서 발생하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
26. 단락 24 또는 25에 있어서, 상기 표적 핵산 서열을 포함하는 이중 가닥 표적 폴리뉴클레오티드는 Cas 단백질에 의해 절단되고, 바람직하게는, 상기 절단은 DNA 절단인, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
27. 단락 24 내지 26 중 어느 하나에 있어서, 상기 표적 폴리뉴클레오티드는 이중 가닥 DNA이고, 상기 사용은 폴리뉴클레오티드에서 이중 가닥 절단을 결과하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
28. 단락 24 또는 25에 있어서, 상기 표적 핵산 서열을 포함하는 표적 폴리뉴클레오티드는 이중 가닥 DNA이고, 상기 Cas 단백질은 이중 가닥 DNA를 절단하는 능력이 없으며, 상기 방법은 표적 폴리뉴클레오티드의 유전자 침묵을 결과하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
29. 단락 24 내지 28 중 어느 하나에 있어서, 상기 PAM 서열은, 5'-NNNNCNNA-3' [SEQ ID NO: 47]을 포함하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
30. 단락 29에 있어서, 상기 PAM 서열은, 5'-NNNNCSAA-3' [SEQ ID NO: 48]을 포함하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
31. 단락 30에 있어서, 상기 PAM 서열은, 5'-NNNNCCAA-3' [SEQ ID NO: 50]을 포함하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
32. 단락 30 또는 31에 있어서, 상기 결합, 절단, 표지 또는 변형은, 20℃ 내지 70℃의 온도에서 발생하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
33. 단락 29 내지 32 중 어느 하나에 있어서, 상기 결합, 절단, 표지 또는 변형은, 25℃ 내지 65℃의 온도에서 발생하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
34. 단락 24 내지 33 중 어느 하나에 있어서, 상기 Cas 단백질은 박테리아, 고세균 또는 바이러스, 바람직하게는, 호열성 박테리아로부터 얻을 수 있는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
35. 단락 24 내지 34 중 어느 하나에 있어서, 상기 Cas 단백질은 지오바실러스 속, 바람직하게는, 지오바실러스 써모데니트리피칸스로부터 얻을 수 있는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
36. 단락 24 내지 35 중 어느 하나에 있어서, 상기 표적화 RNA 분자는 crRNA 및 tracrRNA를 포함하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
37. 단락 24 내지 36 중 어느 하나에 있어서, 상기 적어도 하나의 표적화 RNA 분자의 길이는 35-200 뉴클레오티드 잔기의 범위인, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
38. 단락 24 내지 37 중 어느 하나에 있어서, 상기 표적 핵산 서열은 길이가 15 내지 32 뉴클레오티드 잔기인, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
39. 단락 24 내지 38 중 어느 하나에 있어서, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티를 더욱 포함하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
40. 단락 24 내지 39 중 어느 하나에 있어서, 상기 Cas 단백질은 적어도 하나의 추가의 기능성 또는 비-기능성 단백질을 포함하는 단백질 복합체의 일부로서 제공되고, 선택적으로, 상기 적어도 하나의 추가의 단백질은 적어도 하나의 기능성 모이어티를 더욱 포함하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
41. 단락 39 또는 40에 있어서, 상기 Cas 단백질 또는 추가의 단백질은, Cas 단백질 또는 단백질 복합체의 N-말단 및/또는 C-말단; 바람직하게는, C-말단에 융합 또는 연결된 적어도 하나의 기능성 모이어티를 포함하는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
42. 단락 39 내지 41 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는: 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라제, 포스파타아제, 키나아제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치정보 서열, 항체 에피토프 또는 친화성 정제태그, 예를 들어, 녹색 형광 단백질 (GFP)로부터 선택적으로 선택된 단백질인, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
43. 단락 42에 있어서, 상기 Cas9 뉴클레아제의 고유 활성은 비활성화되고, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티에 연결되는, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
44. 단락 42 또는 43에 있어서, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제도메인; 바람직하게는, FokI 뉴클레아제도메인인, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
45. 단락 42 내지 44 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는 마커 단백질인, 이중 가닥 표적 폴리뉴클레오티드를 결합, 절단, 표지 또는 변형시키는 방법.
46. 단락 20에 있어서, 또는 단락 42에 있어서, 상기 이중 가닥 표적 폴리뉴클레오티드는 dsDNA이고, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제또는 헬리카제-뉴클레아제이며, 및 상기 변형은 원하는 유전자좌에서 단일-가닥 또는 이중-가닥 절단인, 방법.
47. 단락 20에 있어서, 또는 단락 42에 있어서, 상기 이중 가닥 표적 폴리뉴클레오티드는 dsDNA이고, 상기 기능성 모이어티는 DNA 변형 효소 (예를 들어, 메틸라아제또는 아세틸라제), 전사 활성인자 또는 전사 억제인자로부터 선택되며, 및 상기 결합, 절단, 표지 또는 변형은 유전자 발현의 변형을 결과하는, 방법.
48. 단락 20에 있어서, 또는 단락 42에 있어서, 상기 결합, 절단, 표지 또는 변형은 생체 내에서 발생하는, 방법.
49. 단락 48에 있어서, 상기 결합, 절단, 표지 또는 변형은, 호열성 유기체, 바람직하게는 호열성 원핵생물, 좀 더 바람직하게는 지오바실러스 속에서 발생하는, 방법.
50. 단락 48에 있어서, 상기 결합, 절단, 표지 또는 변형은, 중온성 유기체, 바람직하게는 중온성 원핵생물, 좀 더 바람직하게는 슈도모나스 속에서 발생하는, 방법.
51. 단락 1 내지 4, 7 내지 23 또는 46에 있어서, 또는 단락 24 내지 27, 29 내지 46에 있어서, 상기 결합, 절단, 표지 또는 변형은, 원하는 위치에 원하는 뉴클레오티드 서열을 변형, 결손 및/또는 삽입을 결과하고, 및/또는 상기 결합, 절단, 표지 또는 변형은 원하는 유전자좌에서 유전자 발현의 침묵을 결과하는, 방법.
52. 표적 핵산 서열을 포함하는 이중 가닥 표적 폴리뉴클레오티드를 갖는 형질전환된 비-인간 세포로서, 여기서, 상기 이중 가닥 표적 폴리뉴클레오티드는, 상기 표적 핵산 서열을 포함하는 표적 핵산 가닥, 및 상기 표적 핵산 서열에 상보적인 프로토스페이스 핵산 서열을 포함하는 비-표적 핵산 가닥을 포함하며, 상기 세포는:
SEQ ID NO: 1의 아미노산 서열 또는 이와 적어도 77% 동일성의 서열을 갖는, 일정한 간격을 두고 주기적으로 분포하는 짧은 회문구조 반복서열 (CRISPR)-관련 (Cas) 단백질;
상기 표적 핵산 가닥 내에 표적 핵산 서열을 인식하는 적어도 하나의 표적화 RNA 분자로서, 여기서, 비-표적 핵산 가닥은, 프로토스페이서 핵산 서열의 3' 말단에 바로 인접한 프로토스페이서 인근 모티프 (PAM) 서열을 더욱 포함하며, 여기서, 상기 PAM 서열은 5'-NNNNCNN-3'을 포함하는, 적어도 하나의 표적화 RNA 분자; 및
상기 Cas 단백질 및 상기 표적화 RNA 분자 중 적어도 하나를 인코딩하는 핵산을 포함하는 발현 벡터를 포함하는, 형질전환된 비-인간 세포.
53. 단락 52에 있어서, 상기 Cas 단백질 및 표적화 RNA 분자는, 세포에서 표적 폴리뉴클레오티드의 결합, 절단, 표지 또는 변형을 가능하게 하고, 상기 결합, 절단, 표지 또는 변형은, 20℃ 내지 100℃의 온도, 30℃ 내지 80℃의 온도, 37℃ 내지 78℃의 온도, 바람직하게는, 55℃ 이상의 온도; 보다 바람직하게는, 55℃ 내지 80℃의 온도에서; 더욱 바람직하게는, 55℃ 내지 65℃ 또는 60℃ 내지 65℃의 온도에서 발생하는, 형질전환된 비-인간 세포.
54. 단락 52 또는 53에 있어서, 상기 표적 핵산 서열을 포함하는 표적 핵산 가닥은, Cas 단백질에 의해 절단되고, 바람직하게는, 상기 절단은 DNA 절단인, 형질전환된 비-인간 세포.
55. 단락 52 내지 54 중 어느 하나에 있어서, 상기 표적 서열을 포함하는 표적 폴리뉴클레오티드는 이중 가닥 DNA이고, 상기 결합, 절단, 표지 또는 변형은 표적 폴리뉴클레오티드에서 이중 가닥 절단을 결과하는, 형질전환된 비-인간 세포.
56. 단락 52 또는 53에 있어서, 상기 표적 핵산 서열을 포함하는 표적 폴리뉴클레오티드는 이중 가닥 DNA이고, 상기 Cas 단백질은 이중 가닥 DNA를 절단하는 능력이 없으며, 및 상기 결합, 절단, 표지 또는 변형은 표적 폴리뉴클레오티드의 유전자 침묵을 결과하는, 형질전환된 비-인간 세포.
57. 단락 52 내지 56 중 어느 하나에 있어서, 상기 PAM 서열은, 5'-NNNNCNNA-3' [SEQ ID NO: 47]을 포함하는, 형질전환된 비-인간 세포.
58. 단락 57에 있어서, 상기 PAM 서열은, 5'-NNNNCSAA-3' [SEQ ID NO: 48]을 포함하는, 형질전환된 비-인간 세포.
59. 단락 58에 있어서, 상기 PAM 서열은, 5'-NNNNCCAA-3' [SEQ ID NO: 50]을 포함하는, 형질전환된 비-인간 세포.
60. 단락 58 또는 59에 있어서, 상기 결합, 절단, 표지 또는 변형은, 20℃ 내지 70℃의 온도에서 발생하는, 형질전환된 비-인간 세포.
61. 단락 57 내지 60 중 어느 하나에 있어서, 상기 결합, 절단, 표지 또는 변형은, 25℃ 내지 65℃의 온도에서 발생하는, 형질전환된 비-인간 세포.
62. 단락 52 내지 61 중 어느 하나에 있어서, 상기 Cas 단백질은, 박테리아, 고세균 또는 바이러스, 바람직하게는, 호열성 박테리아로부터 얻을 수 있는, 형질전환된 비-인간 세포.
63. 단락 52 내지 62 중 어느 하나에 있어서, 상기 Cas 단백질은 지오바실러스 속, 바람직하게는, 지오바실러스 써모데니트리피칸스로부터 얻을 수 있는, 형질전환된 비-인간 세포.
64. 단락 52 내지 63 중 어느 하나에 있어서, 상기 세포는 원핵세포인, 형질전환된 비-인간 세포.
65. 단락 52 내지 63 중 어느 하나에 있어서, 상기 세포는 진핵세포인, 형질전환된 비-인간 세포.
66. 단락 52 내지 65 중 어느 하나에 있어서, 상기 표적화 RNA 분자는 crRNA 및 tracrRNA를 포함하는, 형질전환된 비-인간 세포.
67. 단락 52 내지 66 중 어느 하나에 있어서, 상기 적어도 하나의 표적화 RNA 분자의 길이는 35-200 뉴클레오티드 잔기의 범위인, 형질전환된 비-인간 세포.
68. 단락 52 내지 67 중 어느 하나에 있어서, 상기 표적 핵산 서열은 길이가 15 내지 32 뉴클레오티드 잔기인, 형질전환된 비-인간 세포.
69. 단락 52 내지 68 중 어느 하나에 있어서, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티를 더욱 포함하는, 형질전환된 비-인간 세포.
70. 단락 52 내지 69 중 어느 하나에 있어서, 상기 Cas 단백질은 적어도 하나의 추가의 기능성 또는 비-기능성 단백질을 포함하는 단백질 복합체의 일부로서 제공되고, 선택적으로, 상기 적어도 하나의 추가의 단백질은 적어도 하나의 기능성 모이어티를 더욱 포함하는, 형질전환된 비-인간 세포.
71. 단락 69 또는 70에 있어서, 상기 Cas 단백질 또는 추가의 단백질은, Cas 단백질 또는 단백질 복합체의 N-말단 및/또는 C-말단; 바람직하게는, N-말단에 융합 또는 연결된 적어도 하나의 기능성 모이어티를 포함하는, 형질전환된 비-인간 세포.
72. 단락 69 내지 71 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는: 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라제, 포스파타아제, 키나아제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치정보 서열, 항체 에피토프 또는 친화성 정제태그, 예를 들어, 녹색 형광 단백질 (GFP)로부터 선택적으로 선택된 단백질인, 형질전환된 비-인간 세포.
73. 단락 72에 있어서, 상기 Cas9 뉴클레아제의 고유 활성은 비활성화되고, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티에 연결되는, 형질전환된 비-인간 세포.
74. 단락 69 내지 73 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제도메인; 바람직하게는, FokI 뉴클레아제도메인인, 형질전환된 비-인간 세포.
75. 단락 69 내지 73 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는 마커 단백질인, 형질전환된 비-인간 세포.
76. 단락 69 내지 74 중 어느 하나에 있어서, 상기 이중 가닥 표적 폴리뉴클레오티드는 dsDNA이고, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제또는 헬리카제-뉴클레아제이며, 및 상기 변형은 원하는 유전자좌에서 단일-가닥 또는 이중-가닥 절단인, 형질전환된 비-인간 세포.
77. 단락 69 내지 73 중 어느 하나에 있어서, 또는 단락 42에 있어서, 상기 이중 가닥 표적 폴리뉴클레오티드는 dsDNA이고, 상기 기능성 모이어티는 DNA 변형 효소 (예를 들어, 메틸라아제또는 아세틸라제), 전사 활성인자 또는 전사 억제인자로부터 선택되며, 및 상기 결합, 절단, 표지 또는 변형은 유전자 발현의 변형을 결과하는, 형질전환된 비-인간 세포 또는 방법.
78. 단락 69 내지 74 중 어느 하나에 있어서, 상기 Cas 단백질은 발현 벡터로부터 발현되는, 형질전환된 비-인간 세포.
79. 단락 52 내지 78 중 어느 하나에 있어서, 상기 결합, 절단, 표지 또는 변형은, 원하는 위치에 원하는 뉴클레오티드 서열을 변형 또는 결손 및/또는 삽입을 결과하고, 및/또는 상기 결합, 절단, 표지 또는 변형은 원하는 유전자좌에서 유전자 발현의 침묵을 결과하는, 형질전환된 비-인간 세포.
80. Cas 단백질, 이중 가닥 표적 폴리뉴클레오티드에서 표적 핵산 서열을 인식하는 적어도 하나의 표적화 RNA 분자, 및 표적 폴리뉴클레오티드를 포함하는 핵산단백질 복합체에 있어서,
상기 Cas 단백질은, SEQ ID NO: 1의 아미노산 서열 또는 이와 적어도 77% 동일성의 서열을 가지며;
상기 이중 가닥 표적 폴리뉴클레오티드는, 상기 표적 핵산 서열을 포함하는, 표적 핵산 가닥, 및 상기 표적 핵산 서열에 상보적인 프로토스페이스 핵산 서열 및 프로토스페이서 서열의 3' 말단에 바로 인접한 프로토스페이서 인근 모티프 (PAM) 서열을 포함하는, 비-표적 핵산 가닥을 포함하고; 여기서, 상기 PAM 서열은 5'-NNNNCNN-3'을 포함하며, 및 상기 핵산단백질 복합체는 인간 세포에 사용되지 않는, 핵산단백질 복합체.
81. 단락 80에 있어서, 상기 핵산단백질 복합체는, 20℃ 내지 100℃의 온도, 30℃ 내지 80℃의 온도, 37℃ 내지 78℃의 온도, 바람직하게는, 55℃ 이상의 온도; 보다 바람직하게는, 55℃ 내지 80℃의 온도에서; 더욱 바람직하게는, 55℃ 내지 65℃ 또는 60℃ 내지 65℃의 온도에서 발생하는, 핵산단백질 복합체.
82. 단락 80 또는 81에 있어서, 상기 표적 핵산 서열을 포함하는 이중 가닥 표적 폴리뉴클레오티드는, Cas 단백질에 의해 절단되고, 바람직하게는, 상기 절단은 DNA 절단인, 핵산단백질 복합체.
83. 단락 80 내지 82 중 어느 하나에 있어서, 상기 표적 서열을 포함하는 표적 폴리뉴클레오티드는 이중 가닥 DNA이고, 상기 결합, 절단, 표지 또는 변형은 표적 폴리뉴클레오티드에서 이중 가닥 절단을 결과하는, 핵산단백질 복합체.
84. 단락 80 또는 81에 있어서, 상기 표적 핵산 서열을 포함하는 표적 폴리뉴클레오티드는 이중 가닥 DNA이고, 상기 Cas 단백질은 이중 가닥 DNA를 절단하는 능력이 없으며, 및 상기 핵산단백질 복합체의 존재는 표적 폴리뉴클레오티드의 유전자 침묵을 결과하는, 핵산단백질 복합체.
85. 단락 80 내지 84 중 어느 하나에 있어서, 상기 PAM 서열은, 5'-NNNNCNNA-3' [SEQ ID NO: 47]을 포함하는, 핵산단백질 복합체.
86. 단락 85에 있어서, 상기 PAM 서열은, 5'-NNNNCSAA-3' [SEQ ID NO: 48]을 포함하는, 핵산단백질 복합체.
87. 단락 86에 있어서, 상기 PAM 서열은, 5'-NNNNCCAA-3' [SEQ ID NO: 50]을 포함하는, 핵산단백질 복합체.
88. 단락 86 또는 87에 있어서, 상기 결합, 절단, 표지 또는 변형은, 20℃ 내지 70℃의 온도에서 발생하는, 핵산단백질 복합체.
89. 단락 85 내지 88 중 어느 하나에 있어서, 상기 결합, 절단, 표지 또는 변형은, 25℃ 내지 65℃의 온도에서 발생하는, 핵산단백질 복합체.
90. 단락 80 내지 89 중 어느 하나에 있어서, 상기 Cas 단백질은 박테리아, 고세균 또는 바이러스, 바람직하게는, 호열성 박테리아로부터 얻을 수 있는, 핵산단백질 복합체.
91. 단락 80 내지 90 중 어느 하나에 있어서, 상기 Cas 단백질은 지오바실러스 속, 바람직하게는, 지오바실러스 써모데니트리피칸스로부터 얻을 수 있는, 핵산단백질 복합체.
92. 단락 80 내지 91 중 어느 하나에 있어서, 상기 핵산단백질 복합체는, 원핵세포 내에 존재하는, 핵산단백질 복합체.
93. 단락 80 내지 91 중 어느 하나에 있어서, 상기 핵산단백질 복합체는 진핵세포 내에 존재하는, 핵산단백질 복합체.
94. 단락 80 내지 93 중 어느 하나에 있어서, 상기 표적화 RNA 분자는 crRNA 및 tracrRNA를 포함하는, 핵산단백질 복합체.
95. 단락 80 내지 94 중 어느 하나에 있어서, 상기 적어도 하나의 표적화 RNA 분자의 길이는 35-200 뉴클레오티드 잔기의 범위인, 핵산단백질 복합체.
96. 단락 80 내지 95 중 어느 하나에 있어서, 상기 표적 핵산 서열은 길이가 15 내지 32 뉴클레오티드 잔기인, 핵산단백질 복합체.
97. 단락 80 내지 96 중 어느 하나에 있어서, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티를 더욱 포함하는, 핵산단백질 복합체.
98. 단락 80 내지 97 중 어느 하나에 있어서, 상기 Cas 단백질은 적어도 하나의 추가의 기능성 또는 비-기능성 단백질을 포함하는 단백질 복합체의 일부로서 제공되고, 선택적으로, 상기 적어도 하나의 추가의 단백질은 적어도 하나의 기능성 모이어티를 더욱 포함하는, 핵산단백질 복합체.
99. 단락 80 내지 98 중 어느 하나에 있어서, 상기 Cas 단백질 또는 추가의 단백질은, Cas 단백질 또는 단백질 복합체의 N-말단 및/또는 C-말단; 바람직하게는, C-말단에 융합 또는 연결된 적어도 하나의 기능성 모이어티를 포함하는, 핵산단백질 복합체.
100. 단락 80 내지 99 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는: 헬리카제, 뉴클레아제, 헬리카제-뉴클레아제, DNA 메틸라아제, 히스톤 메틸라아제, 아세틸라제, 포스파타아제, 키나아제, 전사 활성인자, 전사 억제인자, DNA 결합 단백질, DNA 구조 단백질, 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질, 신호 펩티드, 세포내 위치정보 서열, 항체 에피토프 또는 친화성 정제태그, 예를 들어, 녹색 형광 단백질 (GFP)로부터 선택적으로 선택된 단백질인, 핵산단백질 복합체.
101. 단락 100에 있어서, 상기 Cas9 뉴클레아제의 고유 활성은 비활성화되고, 상기 Cas 단백질은 적어도 하나의 기능성 모이어티에 연결되는, 핵산단백질 복합체.
102. 단락 97 내지 101 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제도메인; 바람직하게는, FokI 뉴클레아제도메인인, 핵산단백질 복합체.
103. 단락 97 내지 101 중 어느 하나에 있어서, 상기 적어도 하나의 기능성 모이어티는 마커 단백질인, 핵산단백질 복합체.
104. 단락 97 내지 102 중 어느 하나에 있어서, 상기 핵산은 dsDNA이고, 상기 적어도 하나의 기능성 모이어티는 뉴클레아제또는 헬리카제-뉴클레아제이며, 및 상기 표적 폴리뉴클레오티드는 원하는 유전자좌에서 단일-가닥 또는 이중-가닥 절단을 갖는, 핵산단백질 복합체.
105. 단락 97 내지 101 중 어느 하나에 있어서, 상기 핵산은 dsDNA이고, 상기 기능성 모이어티는 DNA 변형 효소 (예를 들어, 메틸라아제또는 아세틸라제), 전사 활성인자 또는 전사 억제인자로부터 선택되며, 및 상기 핵산단백질 복합체 형성은 유전자 발현의 변형을 결과하는, 핵산단백질 복합체.
106. 단락 80 내지 105 중 어느 하나에 있어서, 상기 핵산단백질 형성은, 원하는 위치에 원하는 뉴클레오티드 서열을 변형 또는 결손 및/또는 삽입을 결과하고, 및/또는 상기 핵산단백질 복합체 형성은 원하는 유전자좌에서 유전자 발현의 침묵을 결과하는, 핵산단백질 복합체.