KR102399035B1

KR102399035B1 - 산업 균주 내 온-타겟 효율의 감소 없이 오프-타겟이 없는 사이토신 염기 편집기를 발현하는 벡터 및 이의 용도

Info

Publication number: KR102399035B1
Application number: KR1020200136908A
Authority: KR
Inventors: 우한민; 허유빈
Original assignee: 성균관대학교산학협력단
Priority date: 2020-10-21
Filing date: 2020-10-21
Publication date: 2022-05-17
Anticipated expiration: 2040-10-21
Also published as: KR20220053097A

Abstract

본 발명은 염기 편집기 발현용 벡터 및 가이드 RNA 발현용 벡터를 포함하는 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키기 위한 단일 염기 편집용 조성물, 상기 조성물을 포함하는 키트, 상기 벡터에 의해 형질전환된 코리네박테리움 글루타미쿰 균주 및 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키는 방법 등에 관한 것이다. 본 발명에 의하면, 개량된 사이토신 탈아미노화효소를 크리스퍼 염기 편집 기술에 이용하여 기존의 사이토신 탈아미노화효소 수준의 온-타겟 효율은 유지하되, 오프-타겟 효과를 최소화함으로써 기존의 염기 편집 기술이 가지는 한계점을 극복하고 완성도 높은 유전자 조작을 구현할 수 있다. 따라서 본 발명의 단일 염기 편집용 조성물은 목적하는 특정 유전자 상의 사이토신이 타이민으로 전환된 균주의 제작이 용이하도록 하고, 이에 따라 보다 다양한 방면에서 산업 균주, 특히 코리네박테리움 글루타미쿰을 활용할 수 있도록 한다.

Description

산업 균주 내 온-타겟 효율의 감소 없이 오프-타겟이 없는 사이토신 염기 편집기를 발현하는 벡터 및 이의 용도 {Vector expressing cytosine base editor without off-target effect without reduction of on-target efficiency in industrial strains and uses thereof}

본 발명은 염기 편집기 발현용 벡터 및 가이드 RNA 발현용 벡터를 포함하는 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키기 위한 단일 염기 편집용 조성물, 상기 조성물을 포함하는 키트, 상기 벡터에 의해 형질전환된 코리네박테리움 글루타미쿰 균주 및 코리네박테리움 글루타미쿰에서 오프-타겟의 변이 없이 목적 유전자의 발현을 조기에 종결시키는 방법 등에 관한 것이다.

코리네박테리움 글루타미쿰(Corynebacterium glutamicum)은 GRAS (generally recognized as safe) 균주로서 안정성을 보장받았고, 다양한 탄소원을 이용하여 여러 환경에서 빠른 성장이 가능하며, 유전체의 분석이 완료되어 있어 유전자의 특성에 대한 정보가 풍부하다는 특성에 의해 일찍이 산업 균주로서 널리 사용되고 있다. 따라서 코리네박테리움 글루타미쿰을 균주로 하여 유용 물질을 대량으로 생산하기 위해 유전자 조작을 통한 돌연변이 균주 제작에 대한 연구가 다방면으로 진행되어 왔다.

다양한 유전자 조작 기술 중에서도, 크리스퍼(clustered regularly interspaced short palindromic repeats, CRISPR) 시스템과 사이토신 탈아미노화효소를 결합하여 만들어진 염기 편집기(base editor, BE)를 기반으로 한 크리스퍼 염기 편집 기술은 독성이 적고 리컴비니어링(recombineering)에 요구되는 공여체 주형(donor template)을 필요로 하지 않으며, 목표로 하는 DNA 상에 흔적을 남기지 않고 유전자를 조작할 수 있는 등 여러 이점을 가지고 있어 주목받고 있다.

최근 쥐에서 유래한 야생형 사이토신 탈아미노화효소(rAPOBEC1)를 이용한 염기 편집 기술은 목표로 하는 특정 구역(온-타겟, on-target)에 대한 높은 염기 편집 효율을 보여주어, 효과적인 유전자 조작 기술로 인정받은 바 있다. 그러나, 이 기술은 탈아미노화효소의 특성에 의해 목표로 하지 않는 유전체(genomic) DNA 또는 플라스미드 DNA 상에 존재하는 사이토신이 타이민으로 바뀌는 오프-타겟(off-target)의 문제점을 가지며, 이는 마우스 배아(embroy) 및 벼(rice)와 같은 진핵세포 생물을 대상으로 한 연구에서 실제로 검증되었다. 이와 같은 rAPOBEC1에 의해 유발되는 오프-타겟 효과는 무작위적으로 의도하지 않은 유전자 조작을 유발하여 예상할 수 없는 다양한 문제를 야기할 수 있으므로, 반드시 극복해야 할 한계점으로 꼽힌다.

KR 10-2026421 B1

본 발명자들은 개량된 사이토신 탈아미노화효소를 크리스퍼 시스템에 접목하여 만들어진 크리스퍼 염기 편집기(Base editor, BE)를 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 균주에 도입하기 위한 벡터를 구축하였고, 상기 벡터를 이용하여 코리네박테리움 글루타미쿰에서 향상된 크리스퍼 염기 편집 기술을 구현함으로써 목표로 하는 특정 유전자 내의 사이토신을 타이민으로 변환하고 다른 유전자의 염기서열에는 변이가 일어나지 않는 유전자 조작이 가능함을 확인하여 본 발명을 완성하였다.

따라서 본 발명의 목적은 하기의 벡터를 포함하는 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)에서 목적 유전자의 발현을 조기에 종결시키기 위한 단일 염기 편집용 조성물을 제공하는 것이다:

(ⅰ) 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소 또는 90 번째 아미노산이 트립토판에서 타이로신으로 치환되고 126 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는, 염기 편집기 발현용 벡터; 및 (ⅱ) 상기 염기 편집기를 목적 유전자로 표적화하기 위한 가이드 RNA (sgRNA)를 인코딩하는 프로토스페이서 서열 및 이에 작동가능하게 연결된 프로모터를 포함하는, 가이드 RNA 발현용 벡터.

본 발명의 다른 목적은 본 발명에 따른 조성물을 포함하는, 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키기 위한 단일 염기 편집용 키트를 제공하는 것이다.

본 발명의 또 다른 목적은 (a) 본 발명에 따른 조성물을 이용하여 코리네박테리움 글루타미쿰을 형질전환시키는 단계; 및 (b) 상기 형질전환된 코리네박테리움 글루타미쿰을 배양하는 단계를 포함하는, 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키는 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소 또는 90 번째 아미노산이 트립토판에서 타이로신으로 치환되고 126 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는 염기 편집기 발현용 벡터로 형질전환된, 코리네박테리움 글루타미쿰 균주를 제공하는 것이다.

본 발명의 또 다른 목적은 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는 염기 편집기 발현용 벡터를 포함하는, 수탁번호 KCTC14257BP로 기탁된 대장균(Escherichia coli) 균주를 제공하는 것이다.

그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

상기와 같은 본 발명의 목적을 달성하기 위하여, 본 발명은 하기의 벡터를 포함하는 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)에서 목적 유전자의 발현을 조기에 종결시키기 위한 단일 염기 편집용 조성물을 제공한다:

본 발명의 일 구현예에 있어서, 상기 재조합 사이토신 탈아미노화효소는 서열번호 4 및 서열번호 6의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 다른 구현예에 있어서, 상기 염기 편집기 발현용 벡터는 대장균에서의 발현을 위한 ColE 복제기점 서열 및 코리네박테리움 글루타미쿰에서의 발현을 위한 pBL1 복제기점 서열로 이루어진 군에서 선택된 1종 이상의 복제기점 서열을 더 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 또 다른 구현예에 있어서, 상기 코리네박테리움 글루타미쿰은 ATCC 13032 야생형 균주일 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 또 다른 구현예에 있어서, 상기 조성물은 코리네박테리움 글루타미쿰의 목적 유전자 내에서 글루타민 또는 아르지닌을 인코딩하는 코돈의 사이토신을 타이민으로 치환하여 종결코돈을 생성시킴으로써 목적 유전자의 발현을 조기에 종결시킬 수 있다.

본 발명의 또 다른 구현예에 있어서, 상기 조성물은 코리네박테리움 글루타미쿰의 목적 유전자 내에서 트립토판을 인코딩하는 코돈의 구아닌을 아데닌으로 치환하여 종결코돈을 생성시킴으로써 목적 유전자의 발현을 조기에 종결시킬 수 있다.

본 발명의 또 다른 구현예에 있어서, 상기 목적 유전자는 idsA(geranylgeranyl pyrophosphate synthase) 또는 ldh(lactate dehydrogenase)일 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 또 다른 구현예에 있어서, 상기 염기 편집기 발현용 벡터는 서열번호 1 또는 서열번호 2의 염기서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 또 다른 구현예에 있어서, 상기 가이드 RNA 발현용 벡터는 서열번호 11의 염기서열 및 상기 서열에 삽입된 프로토스페이서 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

또한, 본 발명은 본 발명에 따른 조성물을 포함하는, 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키기 위한 단일 염기 편집용 키트를 제공한다.

또한, 본 발명은 (a) 본 발명에 따른 조성물을 이용하여 코리네박테리움 글루타미쿰을 형질전환시키는 단계; 및 (b) 상기 형질전환된 코리네박테리움 글루타미쿰을 배양하는 단계를 포함하는, 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키는 방법을 제공한다.

또한, 본 발명은 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소 또는 90 번째 아미노산이 트립토판에서 타이로신으로 치환되고 126 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는 염기 편집기 발현용 벡터로 형질전환된, 코리네박테리움 글루타미쿰 균주를 제공한다.

본 발명의 일 구현예에 있어서, 상기 균주는 염기 편집기를 목적 유전자로 표적화하기 위한 가이드 RNA (sgRNA)를 인코딩하는 프로토스페이서 서열 및 이에 작동가능하게 연결된 프로모터를 포함하는 가이드 RNA 발현용 벡터에 의해 추가로 형질전환된 것일 수 있다.

또한, 본 발명은 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는 염기 편집기 발현용 벡터를 포함하는, 수탁번호 KCTC14257BP로 기탁된 대장균(Escherichia coli) 균주를 제공한다.

본 발명에 의하면, 개량된 사이토신 탈아미노화효소를 크리스퍼 염기 편집 기술에 이용하여 기존의 사이토신 탈아미노화효소와 비교시 온-타겟 효율을 유지하되 오프-타겟 효과를 최소화함으로써 기존의 염기 편집 기술이 가지는 한계점을 극복하여 완성도 높은 유전자 조작을 구현할 수 있다. 따라서 본 발명의 단일 염기 편집용 조성물을 이용하면 목적하는 특정 유전자 상의 사이토신이 타이민으로 전환된 균주의 제작이 용이해지고, 이에 따라 보다 다양한 방면에서 산업 균주, 특히 코리네박테리움 글루타미쿰을 활용할 수 있을 것으로 기대된다.

도 1은 본 발명에 따른 두 가지 염기 편집기 발현용 벡터의 모식도이다: (상단) rAPOBEC1-R132E를 포함하는 벡터의 모식도; (하단) rAPOBEC1-(W90Y+R126E)를 포함하는 벡터의 모식도.
도 2는 본 발명의 개량된 rAPOBEC1-R132E 또는 rAPOBEC1-(W90Y+R126E)를 포함하는 크리스퍼 유전자 염기 편집 기술의 작용 기작을 나타낸 모식도이다: (좌측) 개량된 rAPOBEC1-R132E 또는 rAPOBEC1-(W90Y+R126E)를 포함하는 염기 편집기 BE3-R132E 또는 YE1-BE3에 의한 온-타겟 염기 편집의 작동 과정을 시각화한 도; (우측) 기존의 rAPOBEC1과 달리 개량된 rAPOBEC1-R132E 또는 rAPOBEC1-(W90Y+R126E)를 포함하는 염기 편집기 BE3-R132E 또는 YE1-BE3에 의해 최소화된 오프-타겟 기작을 시각화한 도.
도 3은 본 발명의 일 실시예에 따른 목적 유전자인 idsA 유전자와 ldh 유전자에서 표적 프로토스페이서 위치 및 아미노산을 나타낸 모식도이다.
도 4a 및 도 4b는 코리네박테리움 글루타미쿰에서 본 발명의 개량된 사이토신 탈아미노화효소를 포함하는 BE3 발현 벡터의 도입을 통해 크리스퍼 유전자 염기 편집 기술을 검증한 도이다(Original-BE3, 기존의 rAPOBEC1를 포함하는 BE3; R132E-BE3, 개량된 rAPOBEC1-R132E를 포함하는 BE3; YE1-BE3, 개량된 rAPOBEC1-(W90Y+R126E)를 포함하는 BE3): (도 4a) 목적 유전자 idsA에서 두 개의 프로토스페이서에 대해 크리스퍼 유전자 염기 편집 기술을 적용하여 사이토신이 타이민으로 바뀐 효율을 비교하여 나타낸 그래프; (도 4b) 목적 유전자 ldh에서 세 개의 프로토스페이서에 대해 크리스퍼 유전자 염기 편집 기술을 적용하여 사이토신이 타이민으로 바뀐 효율을 비교하여 나타낸 그래프.
도 5a 및 도 5b는 본 발명의 개량된 탈아미노화효소 rAPOBCE1- R132E 또는 개량된 rAPOBEC1-(W90Y+R126E)를 이용한 크리스퍼 유전자 염기 편집 기술을 코리네박테리움 글루타미쿰에 구현하여 염기 치환에 의해 ldh 유전자 발현의 조기 종결이 일어난 균주의 유전체(genomic) DNA를 대상으로 WGS(whole genome sequencing)를 시행하여 오프-타겟의 감소를 검증한 도이다: (도 5a) 코리네박테리움 글루타미쿰에서 Original-BE3, R132E-BE3 또는 YE1-BE3를 이용하여 얻은 ldh에 염기 치환이 일어난 돌연변이 균주의 유전체 DNA 상의 전체 SNVs(single nucleotide variants) 개수를 비교한 그래프; (도 5b) 전체 SNVs 중에서 사이토신 탈아미노화효소에 의해 유도되었을 것이라고 예상되는 염기 치환 유형[사이토신(C)의 타이민(T)으로 치환 또는 구아닌(G)의 아데닌(A)으로 치환]의 개수를 비교한 그래프.

본 발명자들은 2016년 처음으로 학계에 발표된 크리스퍼 염기 편집 기술을 바탕으로 하여, 유전자 편집 기술에 필요한 BE3 서열을 확보한 후 코리네박테리움 글루타미쿰 내에서 이를 발현하기 위한 벡터를 구축하여 실제 염기 치환을 검증한 바 있다. 그러나 앞서 기술된 바와 같이, 기존의 쥐에서 유래한 야생형 사이토신 탈아미노화효소를 이용한 염기 편집 기술은 탈아미노화효소의 특성에 의해 목표로 하지 않은 유전체 DNA 또는 플라스미드 DNA 상에 존재하는 사이토신을 타이민으로 바뀌는 오프-타겟(off-target) 효과가 있다는 치명적인 문제점을 갖고 있다. 이는 사람 세포나 쥐, 벼와 같은 진핵세포 생물을 대상으로 한 연구를 통해 실증되었으며, 이러한 문제를 극복하기 위해 사이토신 탈아미노화효소의 DNA 서열에 돌연변이를 유발하거나 쥐가 아닌 다른 개체에서 유래한 사이토신 탈아미노화효소를 사용하는 방향으로 다양한 연구들이 진행되어왔다. 본 발명자들은 코리네박테리움 글루타미쿰에서 온-타겟 효율은 야생형과 비슷한 수준으로 유지하되, 오프-타겟 효과가 최소화된 염기 편집기에 대해 예의 연구한 결과, 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소, 및 90 번째 아미노산이 트립토판에서 타이로신으로 치환되고 126 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소의 현저한 오프-타겟 효과 감소를 확인하여 본 발명을 완성하였다.

본 발명은 크리스퍼 염기 편집 기술을 코리네박테리움 글루타미쿰 균주에 적용하기 위해 3세대 염기 편집기(이하 'BE3'라 함)를 발현시키는 벡터의 구축에 관한 것이다. 본 발명에 따라 구축된 벡터는 코리네박테리움 글루타미쿰 균주의 유전체 DNA 또는 플라스미드 형태의 유전자 상에서 목표로 하는 특정 구역에 존재하는 사이토신을 타이민으로 치환시킴으로써 유전자 조작을 가능하게 한다.

본 발명의 일 실시예에서는, 두 가지의 개량된 사이토신 탈아미노화효소를 포함하는 크리스퍼 유전자 염기 편집기를 코리네박테리움 글루타미쿰에서 발현시키기 위한 벡터를 개발하고, 이를 야생형 균주에 삽입하여 크리스퍼 유전자 염기 편집 능력을 갖춘 균주를 생성하였다(실시예 1 참조).

본 발명의 다른 실시예에서는, 두 가지 개량된 사이토신 탈아미노화효소를 포함하는 크리스퍼 유전자 염기 편집기의 염기 편집 효율을 검증하였고, 그 결과 기존의 BE3와 비교하였을 때, 동등하거나 더 향상된 온-타겟 효율을 나타냄을 확인하였다(실시예 2 참조).

본 발명의 또 다른 실시예에서는, 두 가지 개량된 사이토신 탈아미노화효소를 포함하는 크리스퍼 유전자 염기 편집기의 오프-타겟 감소 효과를 검증하였고, 그 결과 기존의 BE3를 이용한 경우보다 오프-타겟이 현저하게 감소하였음 확인하였다(실시예 3 참조).

따라서 본 발명은 하기의 벡터를 포함하는 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)에서 목적 유전자의 발현을 조기에 종결시키기 위한 단일 염기 편집용 조성물을 제공할 수 있다:

본 발명의 다른 양태로서, 본 발명은 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소 또는 90 번째 아미노산이 트립토판에서 타이로신으로 치환되고 126 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는 염기 편집기 발현용 벡터로 형질전환된, 코리네박테리움 글루타미쿰 균주를 제공할 수 있다.

본 발명에 있어서, 상기 균주는 염기 편집기를 목적 유전자로 표적화하기 위한 가이드 RNA (sgRNA)를 인코딩하는 프로토스페이서 서열 및 이에 작동가능하게 연결된 프로모터를 포함하는 가이드 RNA 발현용 벡터에 의해 추가로 형질전환된 것일 수 있다.

본 발명의 또 다른 양태로서, 본 발명은 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 사이토신 탈아미노화효소; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는 염기 편집기 발현용 벡터를 포함하는, 수탁번호 KCTC14257BP로 기탁된 대장균(Escherichia coli) 균주를 제공할 수 있다.

본 발명의 일 구현예에서, 상기 재조합 사이토신 탈아미노화효소(cytosine deaminase)는 쥐에서 유래된 APOBEC1 단백질일 수 있으며, 132 번째에 위치한 아미노산인 아르지닌(Arginine, R)이 글루탐산(Glutamic acid, E)로 치환된 돌연변이를 포함하는 rAPOBEC1-R132E이거나, 또는 90 번째에 위치한 아미노산인 트립토판(tryptophan, W)이 타이로신(tyrosine, Y)으로, 126 번째에 위치한 아미노산인 아르지닌(arginine, R)이 글루탐산(glutamic acid, E)으로 치환된 돌연변이를 포함하는 rAPOBEC1-(W90Y+R126E)일 수 있다. 본 발명에 있어서, 상기 재조합 사이토신 탈아미노화효소는 서열번호 4 또는 서열번호 6의 아미노산 서열로 이루어진 것일 수 있다. 보다 구체적으로, 상기 rAPOBEC1-R132E는 서열번호 3의 염기서열에 의해 코딩되거나 서열번호 4의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되는 것은 아니다. 또한, 상기 rAPOBEC1-(W90Y+R126E)는 서열번호 5의 염기서열에 의해 코딩되거나 서열번호 5의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되느 것은 아니다.

본 발명의 다른 구현예에 있어서, 상기 Cas9 니케이즈(nickase)는 스트렙토코커스 피오제네스(Streptococcus pyogenes)에서 유래된 Cas9 단백질일 수 있으며, 열 번째 아미노산이 아스파르트산(Asparagine, N)에서 알라닌(Alanine, A)으로 치환된 돌연변이를 포함할 수 있다. 상기와 같은 돌연변이를 포함하는 경우 Cas9 니케이즈가 뉴클레이즈로서의 기능을 일부 상실되고, 이에 따라 유전자가 절단되는 것이 방지되어 독성이 감소하는 효과가 있다. 본 발명에 있어서, 상기 Cas9 니케이즈는 서열번호 7의 염기서열에 의해 코딩되거나 서열번호 8의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 또 다른 구현예에 있어서, 상기 우라실 글라이코실레이즈 억제제(uracil glycosylase inhibitor, UGI)는 고초균 박테리오파지(Bacillus subtilis bacteriophage)에서 유래한 것일 수 있다. 상기 UGI는 DNA 복구 기작에 의해 사이토신에서 우라실로 바뀐 염기가 다시 사이토신으로 돌아가는 것을 막아줌으로써 타이민으로의 최종 염기 편집이 효과적으로 일어날 수 있도록 한다. 본 발명에 있어서, 상기 우라실 글라이코실레이즈 억제제는 서열번호 9의 염기서열에 의해 코딩되거나 서열번호 10의 아미노산 서열로 이루어진 것일 수 있으나, 이에 제한되는 것은 아니다.

상기 염기 편집기 발현용 벡터상에 존재하는 BE3는 개량된 재조합 사이토신 탈아미노화효소 rAPOBEC1-R132E 또는 개량된 재조합 사이토신 탈아미노화효소 rAPOBEC1-(W90Y+R126E), nCas9 니케이즈 및 우라실 글라이코실레이즈 억제제(UGI)로 구성되며, 코리네박테리움 글루타미쿰에서 발현이 가능하도록 재조합되었다. 상기 염기 편집기 발현용 벡터의 구조는 도 1에 나타내었다. 본 발명에 있어서, 상기 재조합 사이토신 탈아미노화효소를 인코딩하는 유전자는 서열번호 3 또는 서열번호 5의 염기서열로 이루어진 것일 수 있고, 상기 Cas9 니케이즈를 인코딩하는 유전자는 서열번호 7의 염기서열로 이루어진 것일 수 있으며, 상기 우라실 글라이코실레이즈 억제제를 인코딩하는 유전자는 서열번호 9의 염기서열로 이루어진 것일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 조성물은 코리네박테리움 글루타미쿰의 목적 유전자 내에서 글루타민 또는 아르지닌을 인코딩하는 코돈의 사이토신을 타이민으로 치환하여 종결코돈을 생성시킴으로써 목적 유전자의 발현을 조기에 종결시키는 것일 수 있다.

또한 본 발명에 있어서, 상기 조성물은 코리네박테리움 글루타미쿰의 목적 유전자 내에서 트립토판을 인코딩하는 코돈의 구아닌을 아데닌으로 치환하여 종결코돈을 생성시킴으로써 목적 유전자의 발현을 조기에 종결시키는 것일 수 있다.

상기 염기 편집기 발현용 벡터(도 1의 pCoryne-BE3-R132E 또는 pCoryne-YE1-BE3)가 코리네박테리움 글루타미쿰 내에서 발현되면 Cas9 니케이즈와 sgRNA 복합체가 PAM(protospacer adjacent motif) 구역을 인식하여 DNA 상에 붙게 된다. 이후 sgRNA가 포함하는 타겟에 대한 정보인 프로토스페이스와 서열이 일치하는지 확인하는 과정에서 DNA 이중가닥이 벌어지게 된다. 이후 사이토신 탈아미노화효소가 작용하여 프로토스페이서 내의 PAM 구역 [PAM으로부터 13-17 번째에 이르는 구역을 활성 윈도우(Active window)라 명명한다.] 으로부터 13-17 번째에 위치한 사이토신이 우라실로 바뀌게 되며, DNA 복제를 통해 타이민으로 치환된다. 이때 우라실 글라이코실레이즈 억제제(UGI)의 작용에 의해 사이토신에서 우라실로 바뀐 돌연변이가 글라이코실화 반응에 의해 다시 사이토신으로 돌아가는 것을 막음으로써 우라실이 타이민으로 치환되는 것이며, 따라서 목표로 하는 염기 치환이 효율적으로 일어날 수 있다. 이후 상보적인 위치에 있는 구아닌 또한 돌연변이 복구과정에 의해 아데닌으로 바뀔 수 있다. 상기와 같은 과정을 통해 온-타겟에 대한 염기 치환이 일어나게 되며 이러한 과정을 도 2의 좌측에 시각화하여 나타내었다.

BE3를 구성하는 기존의 사이토신 탈아미노화효소인 rAPOBEC1과 달리 본 발명의 두 가지 개량된 탈아미노화효소의 경우, 표적 DNA와 상호작용하는 특정 위치의 아미노산이 돌연변이됨으로써 탈아미노화효소와 DNA 간의 친화력이 상대적으로 감소하고, 이에 따라 표적 DNA가 아닌 다른 위치에서의 염기 치환 현상인 오프-타겟 효과가 감소하는 것으로 추측된다. 상기 개량된 rAPOBEC1-R132E 또는 rAPOBEC1-(W90Y+R126E)에 도입된 아미노산 변이에 의해 오프-타겟 감소를 초래하는 기작을 도 2의 우측에 시각화하여 나타내었다.

본 명세서 전체에서, 어떤 부분이 어떤 구성요소를 “포함”한다고 할 때, 이는 특별히 반대되는 기재가 없는한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.

본 명세서에서 사용된 용어 “작동가능하게 연결된”이란, 하나의 핵산 단편이 다른 핵산 단편과 결합되어 그의 기능 또는 발현이 다른 핵산 단편에 의해 영향을 받는 것을 의미한다.

본 명세서에서 사용된 용어 “가이드 RNA”는, 일반적으로 Cas 단백질(nCas 단백질 포함)에 결합할 수 있고 Cas 단백질을 표적 폴리뉴클레오타이드(예를 들어, DNA) 내의 특정 위치에 표적화하는 것을 도울 수 있는 RNA 분자(또는 집합적으로 RNA 분자들의 그룹)를 지칭할 수 있다. 가이드 RNA는 crRNA 분절 및 tracrRNA 분절을 포함할 수 있다. 상기 “crRNA”또는 “분절”이란, 폴리뉴클레오타이드-표적화 가이드 서열, 줄기 서열 및 임의로 5'-오버행 서열을 포함하는 RNA 분자 또는 그의 부분을 지칭한다. 상기 “tracrRNA”또는 “racrRNA 분절”이란, 단백질-결합 분절(예를 들어, 상기 단백질-결합 분절은 크리스퍼-결합된 단백질, 예를 들어 Cas9와 상호작용할 수 있다)을 포함하는 RNA 분자 또는 그의 부분을 지칭한다. 상기 “가이드 RNA”는 단일 가이드 RNA(sgRNA)를 포함하며, 이때 상기 crRNA 분절 및 상기 tracrRNA 분절은 동일한 RNA 분자 중에 위치한다. “가이드 RNA”는 또한 집합적으로 2개 이상의 RNA 분자들의 그룹을 포함하며, 이때 상기 crRNA 및 상기 tracrRNA 분절은 별도의 RNA 분자 중에 위치한다.

본 명세서에서 사용된 용어 “핵산”, “폴리뉴클레오타이드” 또는 “올리고뉴클레오타이드”란, DNA 분자, RNA 분자 또는 이들의 유사체를 지칭한다. 상기 “핵산”, “폴리뉴클레오타이드” 및 “올리고뉴클레오타이드”는 비제한적으로 DNA 분자, 예를 들어 cDNA, 게놈 DNA 또는 합성 DNA 및 RNA 분자, 예를 들어 가이드 RNA, 전령 RNA 또는 합성 RNA를 포함한다. 더욱이, 상기 “핵산” 및 “폴리뉴클레오타이드”란 용어는 단일-가닥 및 이중-가닥 형태를 포함한다.

본 발명에 있어서, 상기 염기 편집기 발현용 벡터는 대장균에서의 발현을 위한 ColE 복제기점 서열 및 코리네박테리움 글루타미쿰에서의 발현을 위한 pBL1 복제기점 서열로 이루어진 군에서 선택된 1종 이상의 복제기점 서열을 더 포함할 수 있다.

본 발명에 있어서, 상기 코리네박테리움 글루타미쿰은 ATCC 13032 야생형 균주일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 목적 유전자는 idsA(geranylgeranyl pyrophosphate synthase) 또는 ldh(lactate dehydrogenase)일 수 있으나, 이에 제한되는 것은 아니다. 목적 유전자는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 프로토스페이스 서열을 적절하게 변경함으로써 코리네박테리움 글루타미쿰 내에서 발현을 조절하고자 하는 임의의 유전자를 목적 유전자로 선택할 수 있다.

본 발명에 있어서, 상기 염기 편집기 발현용 벡터는 서열번호 1 또는 서열번호 2의 염기서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 가이드 RNA 발현용 벡터는 서열번호 11의 염기서열 및 상기 서열에 삽입된 프로토스페이서 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 프로토스페이서 서열은 서열번호 12 내지 서열번호 16으로 표시되는 뉴클레오티드 서열로부터 선택되는 1종 이상일 수 있으나, 이에 제한되는 것은 아니며, 목적 유전자를 인식할 수 있는 가이드 RNA를 인코딩하는 서열이라면 통상의 기술자가 적절히 선택하여 프로토스페이서 서열로 사용할 수 있다.

본 발명의 일 구현예에 있어서, 상기 벡터는 다중클로닝부위, 전사종결자, 및 리포터 유전자로부터 선택되는 하나 이상의 요소를 더 포함할 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 리포터 유전자는 당업계에 알려진 항생제 저항성 유전자 또는 형광 단백질 발현 유전자일 수 있다. 예를 들어, 가이드 RNA를 인코딩하는 프로토스페이서 서열은 상기 다중클로닝부위에 삽입될 수 있고, 바람직하게는 서열번호 11의 염기서열을 포함하는 벡터의 136 번째 염기와 137 번째 염기 사이에 삽입될 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 다른 양태로서, 본 발명은 본 발명에 따른 조성물을 포함하는 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키기 위한 단일 염기 편집용 키트를 제공할 수 있다.

본 발명의 일 구현예에 있어서, 상기 조성물 또는 키트는 PAM 구역으로부터 13 번째 내지 17 번째, 또는 9 번째 내지 17 번째 염기서열 내의 글루타민 및 아르기닌을 인코딩하는 코돈의 사이토신을 타이민으로 전환시킴으로써 종결코돈을 생성하기 위한 것일 수 있고, 구체적으로 PAM 구역으로부터 9 번째 내지 17 번째 염기서열 내의 글루타민 및 아르기닌을 인코딩하는 코돈의 사이토신을 90% 이상, 92% 이상, 95% 이상, 98% 이상 또는 100%의 확률로 타이민으로 전환시킴으로써 종결코돈을 생성하기 위한 것일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 키트는 PAM 구역으로부터 13 번째 내지 17 번째, 또는 9 번째 내지 17 번째 염기서열 내의 트립토판을 인코딩하는 코돈의 구아닌을 90% 이상, 92% 이상, 95% 이상, 98% 이상 또는 100%의 확률로 아데닌으로 전환시킴으로써 종결코돈을 생성하기 위한 것일 수 있다.

본 발명의 또 다른 양태로서, 본 발명은 (a) 본 발명에 따른 조성물을 이용하여 코리네박테리움 글루타미쿰을 형질전환시키는 단계; 및 (b) 상기 형질전환된 코리네박테리움 글루타미쿰을 배양하는 단계를 포함하는, 코리네박테리움 글루타미쿰에서 목적 유전자의 발현을 조기에 종결시키는 방법을 제공할 수 있다.

본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.

이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.

[실시예]

실시예 1. 개량된 사이토신 탈아미노화효소를 포함하는 크리스퍼 유전자 염기 편집을 위한 벡터의 개발

개량된 사이토신 탈아미노화효소의 서열을 확보하기 위해 기존의 pCoryne-BE3(대한민국 공개특허 10-2020-0088093)를 주형으로 한 PCR을 통해 R132E의 부분 돌연변이 또는 W90Y 및 R126E의 부분 돌연변이를 유발하였다. 이렇게 수득한 rAPOBEC1-R132E 또는 rAPOBEC1-(W90Y+R126E)를 포함하는 PCR 단편 조각과 pCoryne-BE3에 제한효소를 처리한 후, 두 DNA 단편을 연결함으로써 본 발명에서 구축하고자 하는 pCoryne-BE3-R132E 벡터 또는 pCoryne-YE1-BE3 벡터를 완성하였다.

pCoryne-BE3-R132E 벡터 또는 pCoryne-YE1-BE3 벡터는 크리스퍼 염기 편집 기술에서 필수적인 염기 편집기(BE3)인 rAPOBEC1, Cas9 니케이즈 (nCas9), 및 우라실 글라이코실레이즈 억제제 (UGI)를 암호화하는 DNA 서열을 포함하며, 이들의 프로모터로서 tetA를 가진다. 또한 대장균(Escherichia coli)과 코리네박테리움 글루타미쿰에서 모두 발현되도록 하기 위한 각각의 복제기점(origin of replication)인 ColE와 pBL1, 해당 벡터를 갖는 균주를 선별하기 위해 사용되는 클로람페니콜 항생제 내성 유전자인 CmR을 암호화하는 서열 등을 포함한다. 벡터의 각 구성요소와 위치는 도 1에 각각 나타내었다.

완성된 pCoryne-BE3-R132E 벡터 또는 pCoryne-YE1-BE3 벡터를 코리네박테리움 글루타미쿰 ATCC 13032 야생형 균주에 삽입하여 크리스퍼 유전자 염기 편집 능력을 갖춘 균주를 만들었다.

또한, 상기 pCoryne-BE3-R132E 벡터를 포함하는 대장균은 2020. 07. 28. 자로 생물자원센터에 수탁번호 KCTC 14257BP로 기탁되었다.

실시예 2. 개량된 사이토신 탈아미노화효소를 포함하는 크리스퍼 유전자 염기 편집기의 염기 치환 검증

2-1. 표적 유전자 및 프로토스페이서(protospacer) 선정

코리네박테리움 글루타미쿰에서 개량된 rAPOBEC1-R132E 또는 rAPOBEC1-(W90Y+R126E)를 이용하는 경우 실제로 염기 치환이 발생하는지 확인하기 위한 실험을 진행하였다. 이를 위해 코리네박테리움 글루타미쿰의 유전체 DNA에 존재하는 두 가지 유전자인 idsA(geranylgeranyl pyrophosphate synthase)와 ldh(lactate dehydrogenase)를 표적 유전자로 선정하였고, 각 유전자에서 활성 윈도우(PAM으로부터 13-17 번째 떨어진 구역) 내에 사이토신을 포함하는 서로 다른 위치의 표적 프로토스페이서를 선정하였다. 유전자 내 각 프로토스페이서의 위치는 도 3에 나타내었으며, 각각의 염기서열은 다음과 같다:

표적 유전자 1 (idsA):

프로토스페이서 1, 5'- CAG CCC ACG CAT AAA GAG GA -3', 서열번호 12;

프로토스페이서 2, 5'- ATT TCC CAG CTG ACT GAA TC -3', 서열번호 13.

표적 유전자 2 (ldh):

프로토스페이서 1, 5'- AAT CGG CCC ACA CAA CAC CA -3', 서열번호 14;

프로토스페이서 2, 5'- ATT TCC ACA CTG CGT AGG TC -3', 서열번호 15;

프로토스페이서 3, 5'- CGC TCG ATT CCG CTA CAT GC -3', 서열번호 16.

2-2. 프로토스페이서를 포함하는 sgRNA 발현 벡터의 제작 및 표적능 검증

20bp 길이의 프로토스페이서 서열을 기반으로 nCas9과 rAPOBEC1을 목적 유전자로 표적화하기 위한 sgRNA 발현 벡터를 제작하였다.

제작된 서로 다른 5개의 sgRNA 발현 벡터를 본 발명에서 구축된 pCoryne-BE3-R132E 벡터 또는 pCoryne-YE1-BE3 벡터를 포함하고 있는 코리네박테리움 글루타미쿰 균주에 각각 도입한 후, 항생제 내성을 기반으로 선별된 콜로니에 대해 PCR을 수행하여 표적 유전자 부분을 증폭시킨 DNA 단편을 확보하였다. 해당 DNA 단편에 대해 시퀀싱을 의뢰하여 염기서열을 확인하였으며, 최종적으로 표적화한 부분의 사이토신이 타이민으로 치환된 것을 확인하였다.

2-3. 개량된 탈아미노화효소의 도입을 통한 염기 편집(치환) 효율의 검증

5개의 서로 다른 프로토스페이서를 표적하는 sgRNA를 도입한 후 DNA 시퀀싱을 통해 실제로 표적화한 구역에 위치한 사이토신이 타이민으로 치환되었는지 여부를 확인하였다.

먼저, 표적 유전자 idsA 내의 서로 다른 두 지역을 2가지 프로토스페이서로 표적한 결과는 다음과 같다:

첫 번째 프로토스페이서(idsA_P1)의 경우, 활성 윈도우(PAM으로부터 C4-C8 번째 구역) 내에 존재하는 사이토신은 4 가지로, 도 4a의 상단 그래프에서 각각 C1, C4, C5, C6, C8 및 C10로 표기하였다(프로토스페이서 내의 위치를 기준으로 함). 개량된 rAPOBEC1-R132E를 포함하는 BE3-R132E의 경우, C6에서 50%, C5에서 15%의 편집 효율을 나타내었다. 이는 original-BE3 즉, 기존의 rAPOBEC1을 포함하는 BE3에 비해서는 상대적으로 낮은 수치이다(도 4a 상단 그래프 참조). 한편, 개량된 rAPOBEC1-(W90Y+R126E)를 포함하는 YE1-BE3의 경우, C5에서 50% 이상, C6에서 70% 이상의 편집 효율을 나타내었다(도 4a의 상단 그래프 참조).

두 번째 프로토스페이서(idsA_P2)의 경우, 활성 윈도우 내에 존재하는 사이토신은 3가지로, 도 4a의 하단 그래프에서 각각 C5, C6 및 C7으로 표기하였다. BE3-R132E는 C5, C6 및 C7 모두에서 100%의 편집 효율을 나타내었고, 이는 기존의 BE3보다 더 높은 편집 효율을 나타낸 것이다(도 4a 하단 그래프 참조). 또한, YE1-BE3의 경우에도 C5에서 100%, C6에서 100%의 편집 효율을 나타냄을 확인하였다(도 4a 하단 그래프 참조).

다음으로, 표적 유전자 ldh 내의 서로 다른 세 지역을 3가지 프로토스페이서로 표적한 결과는 다음과 같다:

첫 번째 프로토스페이서(ldh_P1)의 경우, 활성 윈도우 내에 존재하는 사이토신은 3 가지로, 도 4b의 상단 그래프에서 각각 C4, C7 및 C8로 표기하였다. BE3-R132E, YE1-BE3 및 기존의 BE3 모두 C7 및 C8 위치에서는 편집 효율이 나타나지 않았다. 반면, C4에서는 BE3-R132E의 경우 80% 이상의 편집 효율을 나타내었고, 이는 기존의 BE3보다 더 높은 편집 효율을 나타낸 것이다(도 4b 상단 그래프 참조). YE1-BE3의 경우에는 C4에서 기존의 BE3와 비슷한 효율인 약 70%의 편집 효율을 나타내었다(도 4b 상단 그래프 참조).

두 번째 프로토스페이서(ldh_P2)의 경우, 활성 윈도우 내에 존재하는 사이토신은 3가지로, 도 4b의 중단 그래프에서 각각 C5, C6 및 C8로 표기하였다. C8에서는 개량된 두 가지 BE3 모두 편집 효율을 나타내지 않았고, 이는 기존의 BE3와 동일하였다. 반면, C5, C6에서는 개량된 두 가지 BE3 모두 100%의 편집 효율을 나타내었고, 이는 기존의 BE3와 동일한 수준의 효율을 나타낸 것이다(도 4b 중단 그래프 참조).

세 번째 프로토스페이서(ldh_P3)의 경우, 표적 사이토신은 C5로 BE3-R132E 또는 YE1-BE3를 이용했을 때 모두 100%의 편집 효율을 나타내었고, 이는 기존의 BE3보다 높은 효율을 나타내는 것으로 확인된 것이다(도 4b 하단 그래프 참조).

상기와 같이 코리네박테리움 글루타미쿰의 유전체 DNA 상에 존재하는 두 가지 유전자인 idsA 및 ldh 내의 각기 다른 다섯 가지의 프로토스페이서를 표적하여 효율을 검증한 결과, BE3-R132E 또는 YE1-BE3는 기존의 BE3와 비슷한 정도 또는 그 이상의 편집 효율로 활성 범위내의 사이토신을 타이민으로 치환할 수 있음을 확인하였다. 비록 프로토스페이서의 종류에 따라 어느 정도 효율의 차이는 보였지만, 대체적으로 기존의 BE3와 비교하였을 때, 동등하거나 더 향상된 온-타겟 효율을 나타내었다. 이로써 BE3-R132E 또는 YE1-BE3가 기존의 BE3에 견주는 온-타겟 효율을 나타냄을 검증하였고, 또한 본 발명에서 구축된 벡터가 목적에 맞게 코리네박테리움 글루타미쿰 내에서 정상 작동함을 입증하였다.

실시예 3. 개량된 사이토신 탈아미노화효소를 포함하는 크리스퍼 유전자 염기 편집기의 오프-타겟 감소 효과 검증

전술한 바와 같이, 사이토신 탈아미노화효소인 rAPOBEC1의 개량 목적은 기존의 rAPOBEC1의 특성에 의해 발생하는 높은 수준의 오프-타겟 효과를 최소화하는 데에 있다. 이에 본 발명자들은 rAPOBEC1-R132E 또는 rAPOBEC1-(W90Y+R126E)를 이용하여 코리네박테리움 글루타미쿰 상에서 염기를 치환했을 때, 오프-타겟 현상의 발생 빈도를 확인하고자 하였다. 이를 위해 상기 실시예 2에서 기술된 프로토스페이서 ldh_P2를 이용하되, 기존의 rAPOBEC1을 포함하는 BE3를 이용한 경우(Original-BE3), 본 발명의 개량된 rAPOBEC1-R132E을 이용한 경우(BE3-R132E) 및 개량된 rAPOBEC1-(W90Y+R126E)를 이용한 경우(YE1-BE3)로 나누고, 각각의 경우에 의해 만들어진 ldh의 135 번째에 위치한 아미노산인 트립토판(W)이 종결코돈인 TAA로 바뀐 돌연변이 균주(이하 'ldhW135Ter 균주'라 함)를 선별하였다. 이어서, 각 균주의 유전체 DNA를 추출하였고, 이를 샘플로 하여 전장 유전체 해독(whole genome sequencing, WGS)을 의뢰하였다.

코리네박테리움 글루타미쿰 야생형 균주의 유전체 DNA와 비교하였을 때, 기존의 BE3를 이용하여 만들어진 ldhW135Ter 균주의 경우 48개의 전체 SNVs(single nucleotide variants)가 확인된 반면, BE3-R132E의 경우에는 단 3개의 SNVs만이 확인되었으며, YE1-BE3의 경우에는 8개의 SNVs만이 확인되었다(도 5a 참조). 여기서 상기 전체 SNVs란, 코리네박테리움 글루타미쿰의 야생형 유전체 DNA와 비교하여 ldhW135Ter 균주에서 달라진 염기의 개수를 의미한다.

이어서, 전체 SNVs 중에서도 사이토신 탈아미노화효소에 의해 유도된 염기 치환 유형인 사이토신이 타이민으로(C>T) 치환된 경우 및 상보적 위치의 관점에서 아데닌이 구아닌으로(G>A) 치환된 경우를 별도로 조사하였다. 그 결과 Original-BE3를 이용한 경우 48개, BE3-R132E를 이용한 경우는 2개, YE1-BE3를 이용한 경우는 6개로 나타났다(도 5b 참조).

상기 WGS를 통한 분석 결과는 본 발명의 개량된 BE3-R132E 또는 YE1-BE3를 이용한 염기 편집기에 의해 만들어진 돌연변이 균주에서 기존의 BE3를 이용한 경우보다 오프-타겟이 현저하게 감소하였음을 보여주는 것이다. 특히, 개량된 BE3-R132E 및 YE1-BE3를 이용한 경우 각각 2개 및 6개로 나타난 SNVs는 자연발생적 돌연변이의 수준으로 판단할 수 있는 만큼 본 발명에 따른 염기 편집기는 오프-타겟 효과가 없다고 볼 수 있는 것이다.

상기 결과를 종합하면, 본 발명의 개량된 사이토신 탈아미노화효소 rAPOBEC1-R132E와 rAPOBEC1-(W90Y+R126E)가 실제로 오프-타겟 효과를 최소화하는데 매우 효과적임을 입증한 것이다. 따라서 본 발명에서 목적으로 한 기존의 BE3의 한계점의 극복과 동시에 기존의 BE3와 동등하거나 더 높은 수준의 온-타겟 효율로 염기 편집이 가능함을 코리네박테리움 글루타미쿰 내에서 실증하였다. 이는 코리네박테리움 글루타미쿰 내에서의 유전자 조작 기술로서 BE3-R132E 또는 YE1-BE3를 이용한 염기 편집이 매우 효과적임을 확인한 것이며, 이에 따라, 다양한 목적하에 여러 방면으로 돌연변이 균주 제작을 위해 사용될 수 있을 것으로 기대된다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

한국생명공학연구원

KCTC14257BP

20200728

<110> Research & Business Foundation SUNGKYUNKWAN UNIVERSITY <120> Vector expressing cytosine base editor without off-target effect without reduction of on-target efficiency in industrial strains and uses thereof <130> MP20-143 <160> 16 <170> KoPatentIn 3.0 <210> 1 <211> 10503 <212> DNA <213> Artificial Sequence <220> <223> DNA sequence of pCoryne-BE3-R132E vector <400> 1 gacgtcttaa gacccacttt cacatttaag ttgtttttct aatccgcata tgatcaattc 60 aaggccgaat aagaaggctg gctctgcacc ttggtgatca aataattcga tagcttgtcg 120 taataatggc ggcatactat cagtagtagg tgtttccctt tcttctttag cgacttgatg 180 ctcttgatct tccaatacgc aacctaaagt aaaatgcccc acagcgctga gtgcatataa 240 tgcattctct agtgaaaaac cttgttggca taaaaaggct aattgatttt cgagagtttc 300 atactgtttt tctgtaggcc gtgtacctaa atgtactttt gctccatcgc gatgacttag 360 taaagcacat ctaaaacttt tagcgttatt acgtaaaaaa tcttgccagc tttccccttc 420 taaagggcaa aagtgagtat ggtgcctatc taacatctca atggctaagg cgtcgagcaa 480 agcccgctta ttttttacat gccaatacaa tgtaggctgc tctacaccta gcttctgggc 540 gagtttacgg gttgttaaac cttcgattcc gacctcatta agcagctcta atgcgctgtt 600 aatcacttta cttttatcta atctagacat cattaattcc taatttttgt tgacactcta 660 tcgttgatag agttatttta ccactcccta tcagtgatag agaaaagaat tcaaaagatc 720 ttttgtttaa ctttaagaag gagatatacc atgggcagca gtcatcatca tcaccatcac 780 tcttctgaaa ccggtccggt tgcggttgac ccgaccctgc gtcgtcgtat cgaaccgcac 840 gaattcgaag ttttcttcga cccgcgtgaa ctgcgtaaag aaacctgcct gctgtacgaa 900 atcaactggg gtggtcgtca ctctatctgg cgtcacacct ctcagaacac caacaaacac 960 gttgaagtta acttcatcga aaaattcacc accgaacgtt acttctgccc gaacacccgt 1020 tgctctatca cctggttcct gtcttggtct ccgtgcggtg aatgctctcg tgcgatcacc 1080 gaattcctgt ctcgttaccc gcacgttacc ctgttcatct acatcgcgcg tctgtaccac 1140 cacgcggacc cgcgtaaccg tcagggtctg gaagacctga tctcttctgg tgttaccatc 1200 cagatcatga ccgaacagga atctggttac tgctggcgta acttcgttaa ctactctccg 1260 tctaacgaag cgcactggcc gcgttacccg cacctgtggg ttcgtctgta cgttctggaa 1320 ctgtactgca tcatcctggg tctgccgccg tgcctgaaca tcctgcgtcg taaacagccg 1380 cagctgacct tcttcaccat cgcgctgcag tcttgccact accagcgtct gccgccgcac 1440 atcctgtggg cgaccggtct gaaatccggt agcgaaacac cggggacttc agaatcggcc 1500 accccggagt ctgataagaa atactcaata ggcttagcta tcggcacaaa tagcgtcgga 1560 tgggcggtga tcactgatga atataaggtt ccgtctaaaa agttcaaggt tctgggaaat 1620 acagaccgcc acagtatcaa aaaaaatctt ataggggctc ttttatttga cagtggagag 1680 acagcggaag cgactcgtct caaacggaca gctcgtagaa ggtatacacg tcggaagaat 1740 cgtatttgtt atctacagga gattttttca aatgagatgg cgaaagtaga tgatagtttc 1800 tttcatcgac ttgaagagtc ttttttggtg gaagaagaca agaagcatga acgtcatcct 1860 atttttggaa atatagtaga tgaagttgct tatcatgaga aatatccaac tatctatcat 1920 ctgcgaaaaa aattggtaga ttctactgat aaagcggatt tgcgcttaat ctatttggcc 1980 ttagcgcata tgattaagtt tcgtggtcat tttttgattg agggagattt aaatcctgat 2040 aatagtgatg tggacaaact atttatccag ttggtacaaa cctacaatca attatttgaa 2100 gaaaacccta ttaacgcaag tggagtagat gctaaagcga ttctttctgc acgattgagt 2160 aaatcaagac gattagaaaa tctcattgct cagctccccg gtgagaagaa aaatggctta 2220 tttgggaatc tcattgcttt gtcattgggt ttgaccccta attttaaatc aaattttgat 2280 ttggcagaag atgctaaatt acagctttca aaagatactt acgatgatga tttagataat 2340 ttattggcgc aaattggaga tcaatatgct gatttgtttt tggcagctaa gaatttatca 2400 gatgctattt tactttcaga tatcctaaga gtaaatactg aaataactaa ggctccccta 2460 tcagcttcaa tgattaaacg ctacgatgaa catcatcaag acttgactct tttaaaagct 2520 ttagttcgac aacaacttcc agaaaagtat aaagaaatct tttttgatca atcaaaaaac 2580 ggatatgcag gttatattga tgggggagct agccaagaag aattttataa atttatcaaa 2640 ccaattttag aaaaaatgga tggtactgag gaattattgg tgaaactaaa tcgtgaagat 2700 ttgctgcgca agcaacggac ctttgacaac ggctctattc cccatcaaat tcacttgggt 2760 gagctgcatg ctattttgag aagacaagaa gacttttatc catttttaaa agacaatcgt 2820 gagaagattg aaaaaatctt gacttttcga attccttatt atgttggtcc attggcgcgt 2880 ggcaatagtc gttttgcatg gatgactcgg aagtctgaag aaacaattac cccatggaat 2940 tttgaagaag ttgtcgataa aggtgcttca gctcaatcat ttattgaacg catgacaaac 3000 tttgataaaa atcttccaaa tgaaaaagta ctaccaaaac atagtttgct ttatgagtat 3060 tttacggttt ataacgaatt gacaaaggtc aaatatgtta ctgaaggaat gcgaaaacca 3120 gcatttcttt caggtgaaca gaagaaagcc attgttgatt tactcttcaa aacaaatcga 3180 aaagtaaccg ttaagcaatt aaaagaagat tatttcaaaa aaatagaatg ttttgatagt 3240 gttgaaattt caggagttga agatagattt aatgcttcat taggtaccta ccatgatttg 3300 ctaaaaatta ttaaagataa agattttttg gataatgaag aaaatgaaga tatcttagag 3360 gatattgttt taacattgac cttatttgaa gatagggaga tgattgagga aagacttaaa 3420 acatatgctc acctctttga tgataaggtg atgaaacagc ttaaacgtcg ccgttatact 3480 ggttggggac gtttgtctcg aaaattgatt aatggtatta gggataagca atctggcaaa 3540 acaatattag attttttgaa atcagatggt tttgccaatc gcaattttat gcagctgatc 3600 catgatgata gtttgacatt taaagaagac attcaaaaag cacaagtgtc tggacaaggc 3660 gatagtttac atgaacatat tgcaaattta gctggtagcc ctgctattaa aaaaggtatt 3720 ttacagactg taaaagttgt tgatgaattg gtcaaagtaa tggggcggca taagccagaa 3780 aatatcgtta ttgaaatggc acgtgaaaat cagacaactc aaaagggcca gaaaaattcg 3840 cgagagcgta tgaaacgaat cgaagaaggt atcaaagaat taggaagtca gattcttaaa 3900 gagcatcctg ttgaaaatac tcaattgcaa aatgaaaagc tctatctcta ttatctccaa 3960 aatggaagag acatgtatgt ggaccaagaa ttagatatta atcgtttaag tgattatgat 4020 gtcgatcaca ttgttccaca aagtttcctt aaagacgatt caatagacaa taaggtctta 4080 acgcgttctg ataaaaatcg tggtaaatcg gataacgttc caagtgaaga agtagtcaaa 4140 aagatgaaaa actattggag acaacttcta aacgccaagt taatcactca acgtaagttt 4200 gataatttaa cgaaagctga acgtggaggt ttgagtgaac ttgataaagc tggttttatc 4260 aaacgccaat tggttgaaac tcgccaaatc actaagcatg tggcacaaat tttggatagt 4320 cgcatgaata ctaaatacga tgaaaatgat aaacttattc gagaggttaa agtgattacc 4380 ttaaaatcta aattagtttc tgacttccga aaagatttcc aattctataa agtacgtgag 4440 attaacaatt accatcatgc ccatgatgcg tatctaaatg ccgtcgttgg aactgctttg 4500 attaagaaat atccaaaact tgaatcggag tttgtctatg gtgattataa agtttatgat 4560 gttcgtaaaa tgattgctaa gtctgagcaa gaaataggca aagcaaccgc aaaatatttc 4620 ttttactcta atatcatgaa cttcttcaaa acagaaatta cacttgcaaa tggagagatt 4680 cgcaaacgcc ctctaatcga aactaatggg gaaactggag aaattgtctg ggataaaggg 4740 cgagattttg ccacagtgcg caaagtattg tccatgcccc aagtcaatat tgtcaagaaa 4800 acagaagtac agacaggcgg attctccaag gagtcaattt taccaaaaag aaattcggac 4860 aagcttattg ctcgtaaaaa agactgggat ccaaaaaaat atggtggttt tgatagtcca 4920 acggtagctt attcagtcct agttgttgct aaggtggaaa aagggaaatc gaagaagtta 4980 aaatccgtta aagagttact agggatcaca attatggaaa gaagttcctt tgaaaaaaat 5040 ccgattgact ttttagaagc taaaggatat aaggaagtta aaaaagactt aatcattaaa 5100 ctacctaaat atagtctttt tgagttagaa aacggtcgta aacggatgct ggctagtgcc 5160 ggagaattac aaaaaggaaa tgagctggct ctgccaagca aatatgtgaa ttttttatat 5220 ttagctagtc attatgaaaa gttgaagggt agtccagaag ataacgaaca aaaacaattg 5280 tttgtggagc agcataagca ttatttagat gagattattg agcaaatcag tgaattttct 5340 aagcgtgtta ttttagcaga tgccaattta gataaagttc ttagtgcata taacaaacat 5400 agagacaaac caatacgtga acaagcagaa aatattattc atttatttac gttgacgaat 5460 cttggagctc ccgctgcttt taaatatttt gatacaacaa ttgatcgtaa acgatatacg 5520 tctacaaaag aagttttaga tgccactctt atccatcaat ccatcactgg tctttatgaa 5580 acacgcattg atttgagtca gctaggaggt gactctggtg gttctactaa tctgtcagat 5640 attattgaaa aggagaccgg taagcaactg gttatccagg aatccatcct catgctccca 5700 gaggaggtgg aagaagtcat tgggaacaag ccggaaagcg atatactcgt gcacaccgcc 5760 tacgacgaga gcaccgacga gaatgtcatg cttctgacta gcgacgcccc tgaatacaag 5820 ccttgggctc tggtcataca ggatagcaac ggtgagaaca agattaagat gctcctcgag 5880 taaggatctc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 5940 ttatctgttg tttgtcggtg aacgctctct actagagtca cactggctca ccttcgggtg 6000 ggcctttctg cgtttatacc tagggcgttc ggctgcggcg agcggtatca gcagttattg 6060 gtgcccttcg aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc 6120 accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc caacaacaag 6180 acccatcata gtttgccccc gcgacattga ccataaattc atcgcacaaa atatcgaacg 6240 gggtttatgc cgcttttagt gggtgcgaag aatagtctgc tcattacccg cgaacaccgc 6300 cgcattcaga tcacgcttag tagcgtcccc atgagtaggc agaaccgcgt ccaagtccac 6360 atcatccata acgatcatgc acggggtgga atccacaccc agacttgcca gcacctcatt 6420 agcgacacgt tgcgcagcgg ccacgtcctt agccttatcc acgcaatcga gaacgtactg 6480 cctaaccgcg aaatcagact gaatcagttt ccaatcatcg ggcttcacca aagcaacagc 6540 aacgcgggtt gattcgaccc gttccggtgc ttccagaccg gcgagcttgt acagttcttc 6600 ttccatttca cgacgtacat cagcgtctat gtaatcaatg cccaaagcac gcttagcccc 6660 acgtgaccag gacgaacgca ggtttttaga accaacctca tactcacgcc accgagccac 6720 caaaacagcg tccatatcct cgccggcgtc gctttgatcg gccaacatat ccaacatctg 6780 aaacggcgtg tacgacccct tagacgcggt tttagtagcg gagccagtca gttcctgaga 6840 catgccctta gcgaggtagg ttgccatttt cgcagcgtct ccaccccagg tagacacctg 6900 atcaagtttg accccgtgct cacgcagtgg cgcgtccata ccggccttaa ccacaccagc 6960 agaccagcgg gaaaacatgg aatcctcaaa cgccttgagt tcatcgtcag acagtggacg 7020 atccaagaac aacagcatgt tgcggtgcaa gtgccaaccg ttcgcccaag agtctgtgac 7080 ctcatagtca ctataggtgt gctccacccc gtaccgtgca cgttctttct tccactgaga 7140 tgttttcacc atcgaagagt acgcagtctt aatacccgct tcaacctgcg caaatgactg 7200 tgagcggttg tgtcgaacag tgcccacaaa catcatgagc gcgccacccg ccgccaagtg 7260 attcttagta gcaatagcca gctcaatgcg gcgttcgccc atgacttcca attcagccag 7320 aggtgacccc cagcgagagt gagagttttg cagaccctca aactgcgaag caccgttaga 7380 cgaccaggac accgcaacag cttcgtccct gcgccaccta tggcaccccg ccagagcctt 7440 actattggtg atcttgtaca tgacgttttg cctacgccac gccctagcgc gagtgacctt 7500 agaaccctca ttgacctgcg gttccttaga ggtgttcact tctatttcag tgttactcag 7560 tgttacctag acccgatgtt gtgcggggtt gcgcagtgcg agtttgtgcg ggtgttgtgc 7620 ccgttgtctt agctagtgct atggttgtca attgaaaccc cttcgggtta tgtggccccc 7680 gtgcatatga gttggtagct cgcacggggg tttgtcttgt ctagggacta ttaattttta 7740 gtggtgtttg gtggccgcct agcttggcta tgcgtgccag cttacccgta ctcaatgtta 7800 aagatttgca tcgacatggg agggttacgt gtccgatacc tagggggggt atccgcgact 7860 aggtgccccg gtgctcactg tctgtaccgg cggggcaagc cccacacccc gcatggacag 7920 ggtggctccg ccccctgcac ccccagcaat ctgcatgtac atgttttaca cattagcacg 7980 acatgactgc atgtgcatgc actgcatgca gactaggtaa atatgagtat gtacgactag 8040 taacaggagc actgcacata atgaatgagt tgcaggacaa tgtttgctac gcatgcgcat 8100 gacatatcgc aggaaagcta ctagagtctt aaagcatggc aaccaaggca cagctagaac 8160 agcaactaca agaagctcaa caggcactac aggcgcagca agcgcaggca caagccacca 8220 tcgaagcact agaagcgcag gcaaaggcta agcccgtcgt ggtcaccgca cgcgttcctt 8280 tggcactacg tgaggacatg aagcgcgcag gcatgcagaa cggtgaaaac ctccaagagt 8340 tcatgatcgc cgcgtttacc gagcggctag aaaagctcac caccaccgac aacgaggaaa 8400 acaatgtcta acccactagt tctctttgcc caccgtgacc cggtaaatga cgtgacgttc 8460 gagtgcattg agcacgccac ctacgacaca ctttcacacg ctaaagacca gatcaccgcc 8520 caaatgcaag ccctagacga agaagccgcc ctactgccct aatgggtgtt tcatgggtgt 8580 ttccctagtg tttcatggtg ttttcaccta agctagggaa ttgcgcgaga agtctcgcaa 8640 aaatcagcaa cccccggaac cacacagttc acgggggttc ttctatgcca gaaatcagaa 8700 aggggaacca gtgaacgacc ccgaatggct ggatgatcct ccagcgcggg gatctcatgc 8760 tggagttctt cgcccacccc aaaaggatct aggtgaagat cctttttgat aatctcatga 8820 ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta tgagcaaaag 8880 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 8940 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 9000 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 9060 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 9120 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 9180 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 9240 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 9300 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 9360 ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 9420 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 9480 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 9540 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg actagtgctt 9600 ggattctcac caataaaaaa cgcccggcgg caaccgagcg ttctgaacaa atccagatgg 9660 agttctgagg tcattactgg atctatcaac aggagtccaa gcgagctcga tatcaaatta 9720 cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattc tgccgacatg 9780 gaagccatca caaacggcat gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc 9840 ttgcgtataa tatttgccca tggtgaaaac gggggcgaag aagttgtcca tattggccac 9900 gtttaaatca aaactggtga aactcaccca gggattggct gagacgaaaa acatattctc 9960 aataaaccct ttagggaaat aggccaggtt ttcaccgtaa cacgccacat cttgcgaata 10020 tatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc 10080 agtttgctca tggaaaacgg tgtaacaagg gtgaacacta tcccatatca ccagctcacc 10140 gtctttcatt gccatacgaa attccggatg agcattcatc aggcgggcaa gaatgtgaat 10200 aaaggccgga taaaacttgt gcttattttt ctttacggtc tttaaaaagg ccgtaatatc 10260 cagctgaacg gtctggttat aggtacattg agcaactgac tgaaatgcct caaaatgttc 10320 tttacgatgc cattgggata tatcaacggt ggtatatcca gtgatttttt tctccatttt 10380 agcttcctta gctcctgaaa atctcgataa ctcaaaaaat acgcccggta gtgatcttat 10440 ttcattatgg tgaaagttgg aacctcttac gtgccgatca acgtctcatt ttcgccagat 10500 atc 10503 <210> 2 <211> 10503 <212> DNA <213> Artificial Sequence <220> <223> DNA sequence of pCoryne-YE1-BE3 vector <400> 2 gacgtcttaa gacccacttt cacatttaag ttgtttttct aatccgcata tgatcaattc 60 aaggccgaat aagaaggctg gctctgcacc ttggtgatca aataattcga tagcttgtcg 120 taataatggc ggcatactat cagtagtagg tgtttccctt tcttctttag cgacttgatg 180 ctcttgatct tccaatacgc aacctaaagt aaaatgcccc acagcgctga gtgcatataa 240 tgcattctct agtgaaaaac cttgttggca taaaaaggct aattgatttt cgagagtttc 300 atactgtttt tctgtaggcc gtgtacctaa atgtactttt gctccatcgc gatgacttag 360 taaagcacat ctaaaacttt tagcgttatt acgtaaaaaa tcttgccagc tttccccttc 420 taaagggcaa aagtgagtat ggtgcctatc taacatctca atggctaagg cgtcgagcaa 480 agcccgctta ttttttacat gccaatacaa tgtaggctgc tctacaccta gcttctgggc 540 gagtttacgg gttgttaaac cttcgattcc gacctcatta agcagctcta atgcgctgtt 600 aatcacttta cttttatcta atctagacat cattaattcc taatttttgt tgacactcta 660 tcgttgatag agttatttta ccactcccta tcagtgatag agaaaagaat tcaaaagatc 720 ttttgtttaa ctttaagaag gagatatacc atgggcagca gtcatcatca tcaccatcac 780 tcttctgaaa ccggtccggt tgcggttgac ccgaccctgc gtcgtcgtat cgaaccgcac 840 gaattcgaag ttttcttcga cccgcgtgaa ctgcgtaaag aaacctgcct gctgtacgaa 900 atcaactggg gtggtcgtca ctctatctgg cgtcacacct ctcagaacac caacaaacac 960 gttgaagtta acttcatcga aaaattcacc accgaacgtt acttctgccc gaacacccgt 1020 tgctctatca cctggttcct gtcttactct ccgtgcggtg aatgctctcg tgcgatcacc 1080 gaattcctgt ctcgttaccc gcacgttacc ctgttcatct acatcgcgcg tctgtaccac 1140 cacgcggacc cggaaaaccg tcagggtctg cgtgacctga tctcttctgg tgttaccatc 1200 cagatcatga ccgaacagga atctggttac tgctggcgta acttcgttaa ctactctccg 1260 tctaacgaag cgcactggcc gcgttacccg cacctgtggg ttcgtctgta cgttctggaa 1320 ctgtactgca tcatcctggg tctgccgccg tgcctgaaca tcctgcgtcg taaacagccg 1380 cagctgacct tcttcaccat cgcgctgcag tcttgccact accagcgtct gccgccgcac 1440 atcctgtggg cgaccggtct gaaatccggt agcgaaacac cggggacttc agaatcggcc 1500 accccggagt ctgataagaa atactcaata ggcttagcta tcggcacaaa tagcgtcgga 1560 tgggcggtga tcactgatga atataaggtt ccgtctaaaa agttcaaggt tctgggaaat 1620 acagaccgcc acagtatcaa aaaaaatctt ataggggctc ttttatttga cagtggagag 1680 acagcggaag cgactcgtct caaacggaca gctcgtagaa ggtatacacg tcggaagaat 1740 cgtatttgtt atctacagga gattttttca aatgagatgg cgaaagtaga tgatagtttc 1800 tttcatcgac ttgaagagtc ttttttggtg gaagaagaca agaagcatga acgtcatcct 1860 atttttggaa atatagtaga tgaagttgct tatcatgaga aatatccaac tatctatcat 1920 ctgcgaaaaa aattggtaga ttctactgat aaagcggatt tgcgcttaat ctatttggcc 1980 ttagcgcata tgattaagtt tcgtggtcat tttttgattg agggagattt aaatcctgat 2040 aatagtgatg tggacaaact atttatccag ttggtacaaa cctacaatca attatttgaa 2100 gaaaacccta ttaacgcaag tggagtagat gctaaagcga ttctttctgc acgattgagt 2160 aaatcaagac gattagaaaa tctcattgct cagctccccg gtgagaagaa aaatggctta 2220 tttgggaatc tcattgcttt gtcattgggt ttgaccccta attttaaatc aaattttgat 2280 ttggcagaag atgctaaatt acagctttca aaagatactt acgatgatga tttagataat 2340 ttattggcgc aaattggaga tcaatatgct gatttgtttt tggcagctaa gaatttatca 2400 gatgctattt tactttcaga tatcctaaga gtaaatactg aaataactaa ggctccccta 2460 tcagcttcaa tgattaaacg ctacgatgaa catcatcaag acttgactct tttaaaagct 2520 ttagttcgac aacaacttcc agaaaagtat aaagaaatct tttttgatca atcaaaaaac 2580 ggatatgcag gttatattga tgggggagct agccaagaag aattttataa atttatcaaa 2640 ccaattttag aaaaaatgga tggtactgag gaattattgg tgaaactaaa tcgtgaagat 2700 ttgctgcgca agcaacggac ctttgacaac ggctctattc cccatcaaat tcacttgggt 2760 gagctgcatg ctattttgag aagacaagaa gacttttatc catttttaaa agacaatcgt 2820 gagaagattg aaaaaatctt gacttttcga attccttatt atgttggtcc attggcgcgt 2880 ggcaatagtc gttttgcatg gatgactcgg aagtctgaag aaacaattac cccatggaat 2940 tttgaagaag ttgtcgataa aggtgcttca gctcaatcat ttattgaacg catgacaaac 3000 tttgataaaa atcttccaaa tgaaaaagta ctaccaaaac atagtttgct ttatgagtat 3060 tttacggttt ataacgaatt gacaaaggtc aaatatgtta ctgaaggaat gcgaaaacca 3120 gcatttcttt caggtgaaca gaagaaagcc attgttgatt tactcttcaa aacaaatcga 3180 aaagtaaccg ttaagcaatt aaaagaagat tatttcaaaa aaatagaatg ttttgatagt 3240 gttgaaattt caggagttga agatagattt aatgcttcat taggtaccta ccatgatttg 3300 ctaaaaatta ttaaagataa agattttttg gataatgaag aaaatgaaga tatcttagag 3360 gatattgttt taacattgac cttatttgaa gatagggaga tgattgagga aagacttaaa 3420 acatatgctc acctctttga tgataaggtg atgaaacagc ttaaacgtcg ccgttatact 3480 ggttggggac gtttgtctcg aaaattgatt aatggtatta gggataagca atctggcaaa 3540 acaatattag attttttgaa atcagatggt tttgccaatc gcaattttat gcagctgatc 3600 catgatgata gtttgacatt taaagaagac attcaaaaag cacaagtgtc tggacaaggc 3660 gatagtttac atgaacatat tgcaaattta gctggtagcc ctgctattaa aaaaggtatt 3720 ttacagactg taaaagttgt tgatgaattg gtcaaagtaa tggggcggca taagccagaa 3780 aatatcgtta ttgaaatggc acgtgaaaat cagacaactc aaaagggcca gaaaaattcg 3840 cgagagcgta tgaaacgaat cgaagaaggt atcaaagaat taggaagtca gattcttaaa 3900 gagcatcctg ttgaaaatac tcaattgcaa aatgaaaagc tctatctcta ttatctccaa 3960 aatggaagag acatgtatgt ggaccaagaa ttagatatta atcgtttaag tgattatgat 4020 gtcgatcaca ttgttccaca aagtttcctt aaagacgatt caatagacaa taaggtctta 4080 acgcgttctg ataaaaatcg tggtaaatcg gataacgttc caagtgaaga agtagtcaaa 4140 aagatgaaaa actattggag acaacttcta aacgccaagt taatcactca acgtaagttt 4200 gataatttaa cgaaagctga acgtggaggt ttgagtgaac ttgataaagc tggttttatc 4260 aaacgccaat tggttgaaac tcgccaaatc actaagcatg tggcacaaat tttggatagt 4320 cgcatgaata ctaaatacga tgaaaatgat aaacttattc gagaggttaa agtgattacc 4380 ttaaaatcta aattagtttc tgacttccga aaagatttcc aattctataa agtacgtgag 4440 attaacaatt accatcatgc ccatgatgcg tatctaaatg ccgtcgttgg aactgctttg 4500 attaagaaat atccaaaact tgaatcggag tttgtctatg gtgattataa agtttatgat 4560 gttcgtaaaa tgattgctaa gtctgagcaa gaaataggca aagcaaccgc aaaatatttc 4620 ttttactcta atatcatgaa cttcttcaaa acagaaatta cacttgcaaa tggagagatt 4680 cgcaaacgcc ctctaatcga aactaatggg gaaactggag aaattgtctg ggataaaggg 4740 cgagattttg ccacagtgcg caaagtattg tccatgcccc aagtcaatat tgtcaagaaa 4800 acagaagtac agacaggcgg attctccaag gagtcaattt taccaaaaag aaattcggac 4860 aagcttattg ctcgtaaaaa agactgggat ccaaaaaaat atggtggttt tgatagtcca 4920 acggtagctt attcagtcct agttgttgct aaggtggaaa aagggaaatc gaagaagtta 4980 aaatccgtta aagagttact agggatcaca attatggaaa gaagttcctt tgaaaaaaat 5040 ccgattgact ttttagaagc taaaggatat aaggaagtta aaaaagactt aatcattaaa 5100 ctacctaaat atagtctttt tgagttagaa aacggtcgta aacggatgct ggctagtgcc 5160 ggagaattac aaaaaggaaa tgagctggct ctgccaagca aatatgtgaa ttttttatat 5220 ttagctagtc attatgaaaa gttgaagggt agtccagaag ataacgaaca aaaacaattg 5280 tttgtggagc agcataagca ttatttagat gagattattg agcaaatcag tgaattttct 5340 aagcgtgtta ttttagcaga tgccaattta gataaagttc ttagtgcata taacaaacat 5400 agagacaaac caatacgtga acaagcagaa aatattattc atttatttac gttgacgaat 5460 cttggagctc ccgctgcttt taaatatttt gatacaacaa ttgatcgtaa acgatatacg 5520 tctacaaaag aagttttaga tgccactctt atccatcaat ccatcactgg tctttatgaa 5580 acacgcattg atttgagtca gctaggaggt gactctggtg gttctactaa tctgtcagat 5640 attattgaaa aggagaccgg taagcaactg gttatccagg aatccatcct catgctccca 5700 gaggaggtgg aagaagtcat tgggaacaag ccggaaagcg atatactcgt gcacaccgcc 5760 tacgacgaga gcaccgacga gaatgtcatg cttctgacta gcgacgcccc tgaatacaag 5820 ccttgggctc tggtcataca ggatagcaac ggtgagaaca agattaagat gctcctcgag 5880 taaggatctc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 5940 ttatctgttg tttgtcggtg aacgctctct actagagtca cactggctca ccttcgggtg 6000 ggcctttctg cgtttatacc tagggcgttc ggctgcggcg agcggtatca gcagttattg 6060 gtgcccttcg aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc 6120 accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc caacaacaag 6180 acccatcata gtttgccccc gcgacattga ccataaattc atcgcacaaa atatcgaacg 6240 gggtttatgc cgcttttagt gggtgcgaag aatagtctgc tcattacccg cgaacaccgc 6300 cgcattcaga tcacgcttag tagcgtcccc atgagtaggc agaaccgcgt ccaagtccac 6360 atcatccata acgatcatgc acggggtgga atccacaccc agacttgcca gcacctcatt 6420 agcgacacgt tgcgcagcgg ccacgtcctt agccttatcc acgcaatcga gaacgtactg 6480 cctaaccgcg aaatcagact gaatcagttt ccaatcatcg ggcttcacca aagcaacagc 6540 aacgcgggtt gattcgaccc gttccggtgc ttccagaccg gcgagcttgt acagttcttc 6600 ttccatttca cgacgtacat cagcgtctat gtaatcaatg cccaaagcac gcttagcccc 6660 acgtgaccag gacgaacgca ggtttttaga accaacctca tactcacgcc accgagccac 6720 caaaacagcg tccatatcct cgccggcgtc gctttgatcg gccaacatat ccaacatctg 6780 aaacggcgtg tacgacccct tagacgcggt tttagtagcg gagccagtca gttcctgaga 6840 catgccctta gcgaggtagg ttgccatttt cgcagcgtct ccaccccagg tagacacctg 6900 atcaagtttg accccgtgct cacgcagtgg cgcgtccata ccggccttaa ccacaccagc 6960 agaccagcgg gaaaacatgg aatcctcaaa cgccttgagt tcatcgtcag acagtggacg 7020 atccaagaac aacagcatgt tgcggtgcaa gtgccaaccg ttcgcccaag agtctgtgac 7080 ctcatagtca ctataggtgt gctccacccc gtaccgtgca cgttctttct tccactgaga 7140 tgttttcacc atcgaagagt acgcagtctt aatacccgct tcaacctgcg caaatgactg 7200 tgagcggttg tgtcgaacag tgcccacaaa catcatgagc gcgccacccg ccgccaagtg 7260 attcttagta gcaatagcca gctcaatgcg gcgttcgccc atgacttcca attcagccag 7320 aggtgacccc cagcgagagt gagagttttg cagaccctca aactgcgaag caccgttaga 7380 cgaccaggac accgcaacag cttcgtccct gcgccaccta tggcaccccg ccagagcctt 7440 actattggtg atcttgtaca tgacgttttg cctacgccac gccctagcgc gagtgacctt 7500 agaaccctca ttgacctgcg gttccttaga ggtgttcact tctatttcag tgttactcag 7560 tgttacctag acccgatgtt gtgcggggtt gcgcagtgcg agtttgtgcg ggtgttgtgc 7620 ccgttgtctt agctagtgct atggttgtca attgaaaccc cttcgggtta tgtggccccc 7680 gtgcatatga gttggtagct cgcacggggg tttgtcttgt ctagggacta ttaattttta 7740 gtggtgtttg gtggccgcct agcttggcta tgcgtgccag cttacccgta ctcaatgtta 7800 aagatttgca tcgacatggg agggttacgt gtccgatacc tagggggggt atccgcgact 7860 aggtgccccg gtgctcactg tctgtaccgg cggggcaagc cccacacccc gcatggacag 7920 ggtggctccg ccccctgcac ccccagcaat ctgcatgtac atgttttaca cattagcacg 7980 acatgactgc atgtgcatgc actgcatgca gactaggtaa atatgagtat gtacgactag 8040 taacaggagc actgcacata atgaatgagt tgcaggacaa tgtttgctac gcatgcgcat 8100 gacatatcgc aggaaagcta ctagagtctt aaagcatggc aaccaaggca cagctagaac 8160 agcaactaca agaagctcaa caggcactac aggcgcagca agcgcaggca caagccacca 8220 tcgaagcact agaagcgcag gcaaaggcta agcccgtcgt ggtcaccgca cgcgttcctt 8280 tggcactacg tgaggacatg aagcgcgcag gcatgcagaa cggtgaaaac ctccaagagt 8340 tcatgatcgc cgcgtttacc gagcggctag aaaagctcac caccaccgac aacgaggaaa 8400 acaatgtcta acccactagt tctctttgcc caccgtgacc cggtaaatga cgtgacgttc 8460 gagtgcattg agcacgccac ctacgacaca ctttcacacg ctaaagacca gatcaccgcc 8520 caaatgcaag ccctagacga agaagccgcc ctactgccct aatgggtgtt tcatgggtgt 8580 ttccctagtg tttcatggtg ttttcaccta agctagggaa ttgcgcgaga agtctcgcaa 8640 aaatcagcaa cccccggaac cacacagttc acgggggttc ttctatgcca gaaatcagaa 8700 aggggaacca gtgaacgacc ccgaatggct ggatgatcct ccagcgcggg gatctcatgc 8760 tggagttctt cgcccacccc aaaaggatct aggtgaagat cctttttgat aatctcatga 8820 ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta tgagcaaaag 8880 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 8940 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 9000 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 9060 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 9120 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 9180 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 9240 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 9300 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 9360 ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 9420 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 9480 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 9540 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg actagtgctt 9600 ggattctcac caataaaaaa cgcccggcgg caaccgagcg ttctgaacaa atccagatgg 9660 agttctgagg tcattactgg atctatcaac aggagtccaa gcgagctcga tatcaaatta 9720 cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattc tgccgacatg 9780 gaagccatca caaacggcat gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc 9840 ttgcgtataa tatttgccca tggtgaaaac gggggcgaag aagttgtcca tattggccac 9900 gtttaaatca aaactggtga aactcaccca gggattggct gagacgaaaa acatattctc 9960 aataaaccct ttagggaaat aggccaggtt ttcaccgtaa cacgccacat cttgcgaata 10020 tatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc 10080 agtttgctca tggaaaacgg tgtaacaagg gtgaacacta tcccatatca ccagctcacc 10140 gtctttcatt gccatacgaa attccggatg agcattcatc aggcgggcaa gaatgtgaat 10200 aaaggccgga taaaacttgt gcttattttt ctttacggtc tttaaaaagg ccgtaatatc 10260 cagctgaacg gtctggttat aggtacattg agcaactgac tgaaatgcct caaaatgttc 10320 tttacgatgc cattgggata tatcaacggt ggtatatcca gtgatttttt tctccatttt 10380 agcttcctta gctcctgaaa atctcgataa ctcaaaaaat acgcccggta gtgatcttat 10440 ttcattatgg tgaaagttgg aacctcttac gtgccgatca acgtctcatt ttcgccagat 10500 atc 10503 <210> 3 <211> 684 <212> DNA <213> Artificial Sequence <220> <223> DNA sequence of rAPOBEC1-R132E <400> 3 tcttctgaaa ccggtccggt tgcggttgac ccgaccctgc gtcgtcgtat cgaaccgcac 60 gaattcgaag ttttcttcga cccgcgtgaa ctgcgtaaag aaacctgcct gctgtacgaa 120 atcaactggg gtggtcgtca ctctatctgg cgtcacacct ctcagaacac caacaaacac 180 gttgaagtta acttcatcga aaaattcacc accgaacgtt acttctgccc gaacacccgt 240 tgctctatca cctggttcct gtcttggtct ccgtgcggtg aatgctctcg tgcgatcacc 300 gaattcctgt ctcgttaccc gcacgttacc ctgttcatct acatcgcgcg tctgtaccac 360 cacgcggacc cgcgtaaccg tcagggtctg gaagacctga tctcttctgg tgttaccatc 420 cagatcatga ccgaacagga atctggttac tgctggcgta acttcgttaa ctactctccg 480 tctaacgaag cgcactggcc gcgttacccg cacctgtggg ttcgtctgta cgttctggaa 540 ctgtactgca tcatcctggg tctgccgccg tgcctgaaca tcctgcgtcg taaacagccg 600 cagctgacct tcttcaccat cgcgctgcag tcttgccact accagcgtct gccgccgcac 660 atcctgtggg cgaccggtct gaaa 684 <210> 4 <211> 228 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of rAPOBEC1-R132E <400> 4 Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg 1 5 10 15 Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg 20 25 30 Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser 35 40 45 Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn 50 55 60 Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg 65 70 75 80 Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser 85 90 95 Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe 100 105 110 Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln 115 120 125 Gly Leu Glu Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr 130 135 140 Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro 145 150 155 160 Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu 165 170 175 Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu 180 185 190 Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala 195 200 205 Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala 210 215 220 Thr Gly Leu Lys 225 <210> 5 <211> 684 <212> DNA <213> Artificial Sequence <220> <223> DNA sequence of rAPOBEC-W90Y+R126E <400> 5 tcttctgaaa ccggtccggt tgcggttgac ccgaccctgc gtcgtcgtat cgaaccgcac 60 gaattcgaag ttttcttcga cccgcgtgaa ctgcgtaaag aaacctgcct gctgtacgaa 120 atcaactggg gtggtcgtca ctctatctgg cgtcacacct ctcagaacac caacaaacac 180 gttgaagtta acttcatcga aaaattcacc accgaacgtt acttctgccc gaacacccgt 240 tgctctatca cctggttcct gtcttactct ccgtgcggtg aatgctctcg tgcgatcacc 300 gaattcctgt ctcgttaccc gcacgttacc ctgttcatct acatcgcgcg tctgtaccac 360 cacgcggacc cggaaaaccg tcagggtctg cgtgacctga tctcttctgg tgttaccatc 420 cagatcatga ccgaacagga atctggttac tgctggcgta acttcgttaa ctactctccg 480 tctaacgaag cgcactggcc gcgttacccg cacctgtggg ttcgtctgta cgttctggaa 540 ctgtactgca tcatcctggg tctgccgccg tgcctgaaca tcctgcgtcg taaacagccg 600 cagctgacct tcttcaccat cgcgctgcag tcttgccact accagcgtct gccgccgcac 660 atcctgtggg cgaccggtct gaaa 684 <210> 6 <211> 228 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of rAPOBEC-W90Y+R126E <400> 6 Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg 1 5 10 15 Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg 20 25 30 Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser 35 40 45 Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn 50 55 60 Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg 65 70 75 80 Cys Ser Ile Thr Trp Phe Leu Ser Tyr Ser Pro Cys Gly Glu Cys Ser 85 90 95 Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe 100 105 110 Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Glu Asn Arg Gln 115 120 125 Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr 130 135 140 Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro 145 150 155 160 Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu 165 170 175 Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu 180 185 190 Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala 195 200 205 Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala 210 215 220 Thr Gly Leu Lys 225 <210> 7 <211> 4101 <212> DNA <213> Artificial Sequence <220> <223> DNA sequence of nCas9 <400> 7 gataagaaat actcaatagg cttagctatc ggcacaaata gcgtcggatg ggcggtgatc 60 actgatgaat ataaggttcc gtctaaaaag ttcaaggttc tgggaaatac agaccgccac 120 agtatcaaaa aaaatcttat aggggctctt ttatttgaca gtggagagac agcggaagcg 180 actcgtctca aacggacagc tcgtagaagg tatacacgtc ggaagaatcg tatttgttat 240 ctacaggaga ttttttcaaa tgagatggcg aaagtagatg atagtttctt tcatcgactt 300 gaagagtctt ttttggtgga agaagacaag aagcatgaac gtcatcctat ttttggaaat 360 atagtagatg aagttgctta tcatgagaaa tatccaacta tctatcatct gcgaaaaaaa 420 ttggtagatt ctactgataa agcggatttg cgcttaatct atttggcctt agcgcatatg 480 attaagtttc gtggtcattt tttgattgag ggagatttaa atcctgataa tagtgatgtg 540 gacaaactat ttatccagtt ggtacaaacc tacaatcaat tatttgaaga aaaccctatt 600 aacgcaagtg gagtagatgc taaagcgatt ctttctgcac gattgagtaa atcaagacga 660 ttagaaaatc tcattgctca gctccccggt gagaagaaaa atggcttatt tgggaatctc 720 attgctttgt cattgggttt gacccctaat tttaaatcaa attttgattt ggcagaagat 780 gctaaattac agctttcaaa agatacttac gatgatgatt tagataattt attggcgcaa 840 attggagatc aatatgctga tttgtttttg gcagctaaga atttatcaga tgctatttta 900 ctttcagata tcctaagagt aaatactgaa ataactaagg ctcccctatc agcttcaatg 960 attaaacgct acgatgaaca tcatcaagac ttgactcttt taaaagcttt agttcgacaa 1020 caacttccag aaaagtataa agaaatcttt tttgatcaat caaaaaacgg atatgcaggt 1080 tatattgatg ggggagctag ccaagaagaa ttttataaat ttatcaaacc aattttagaa 1140 aaaatggatg gtactgagga attattggtg aaactaaatc gtgaagattt gctgcgcaag 1200 caacggacct ttgacaacgg ctctattccc catcaaattc acttgggtga gctgcatgct 1260 attttgagaa gacaagaaga cttttatcca tttttaaaag acaatcgtga gaagattgaa 1320 aaaatcttga cttttcgaat tccttattat gttggtccat tggcgcgtgg caatagtcgt 1380 tttgcatgga tgactcggaa gtctgaagaa acaattaccc catggaattt tgaagaagtt 1440 gtcgataaag gtgcttcagc tcaatcattt attgaacgca tgacaaactt tgataaaaat 1500 cttccaaatg aaaaagtact accaaaacat agtttgcttt atgagtattt tacggtttat 1560 aacgaattga caaaggtcaa atatgttact gaaggaatgc gaaaaccagc atttctttca 1620 ggtgaacaga agaaagccat tgttgattta ctcttcaaaa caaatcgaaa agtaaccgtt 1680 aagcaattaa aagaagatta tttcaaaaaa atagaatgtt ttgatagtgt tgaaatttca 1740 ggagttgaag atagatttaa tgcttcatta ggtacctacc atgatttgct aaaaattatt 1800 aaagataaag attttttgga taatgaagaa aatgaagata tcttagagga tattgtttta 1860 acattgacct tatttgaaga tagggagatg attgaggaaa gacttaaaac atatgctcac 1920 ctctttgatg ataaggtgat gaaacagctt aaacgtcgcc gttatactgg ttggggacgt 1980 ttgtctcgaa aattgattaa tggtattagg gataagcaat ctggcaaaac aatattagat 2040 tttttgaaat cagatggttt tgccaatcgc aattttatgc agctgatcca tgatgatagt 2100 ttgacattta aagaagacat tcaaaaagca caagtgtctg gacaaggcga tagtttacat 2160 gaacatattg caaatttagc tggtagccct gctattaaaa aaggtatttt acagactgta 2220 aaagttgttg atgaattggt caaagtaatg gggcggcata agccagaaaa tatcgttatt 2280 gaaatggcac gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg 2340 aaacgaatcg aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt 2400 gaaaatactc aattgcaaaa tgaaaagctc tatctctatt atctccaaaa tggaagagac 2460 atgtatgtgg accaagaatt agatattaat cgtttaagtg attatgatgt cgatcacatt 2520 gttccacaaa gtttccttaa agacgattca atagacaata aggtcttaac gcgttctgat 2580 aaaaatcgtg gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac 2640 tattggagac aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg 2700 aaagctgaac gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg 2760 gttgaaactc gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact 2820 aaatacgatg aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa 2880 ttagtttctg acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac 2940 catcatgccc atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat 3000 ccaaaacttg aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg 3060 attgctaagt ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat 3120 atcatgaact tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct 3180 ctaatcgaaa ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc 3240 acagtgcgca aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag 3300 acaggcggat tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct 3360 cgtaaaaaag actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat 3420 tcagtcctag ttgttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa 3480 gagttactag ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt 3540 ttagaagcta aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat 3600 agtctttttg agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa 3660 aaaggaaatg agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat 3720 tatgaaaagt tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag 3780 cataagcatt atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt 3840 ttagcagatg ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca 3900 atacgtgaac aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctccc 3960 gctgctttta aatattttga tacaacaatt gatcgtaaac gatatacgtc tacaaaagaa 4020 gttttagatg ccactcttat ccatcaatcc atcactggtc tttatgaaac acgcattgat 4080 ttgagtcagc taggaggtga c 4101 <210> 8 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of nCas9 <400> 8 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1010 1015 1020 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn 1025 1030 1035 1040 Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile 1045 1050 1055 Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val 1060 1065 1070 Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met 1075 1080 1085 Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe 1090 1095 1100 Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala 1105 1110 1115 1120 Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1125 1130 1135 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys 1140 1145 1150 Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met 1155 1160 1165 Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1170 1175 1180 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1185 1190 1195 1200 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1205 1210 1215 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1250 1255 1260 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile 1265 1270 1275 1280 Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His 1285 1290 1295 Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe 1300 1305 1310 Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr 1315 1320 1325 Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala 1330 1335 1340 Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp 1345 1350 1355 1360 Leu Ser Gln Leu Gly Gly Asp 1365 <210> 9 <211> 249 <212> DNA <213> Artificial Sequence <220> <223> DNA sequence of UGI <400> 9 actaatctgt cagatattat tgaaaaggag accggtaagc aactggttat ccaggaatcc 60 atcctcatgc tcccagagga ggtggaagaa gtcattggga acaagccgga aagcgatata 120 ctcgtgcaca ccgcctacga cgagagcacc gacgagaatg tcatgcttct gactagcgac 180 gcccctgaat acaagccttg ggctctggtc atacaggata gcaacggtga gaacaagatt 240 aagatgctc 249 <210> 10 <211> 83 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of UGI <400> 10 Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val 1 5 10 15 Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile 20 25 30 Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu 35 40 45 Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr 50 55 60 Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile 65 70 75 80 Lys Met Leu <210> 11 <211> 7184 <212> DNA <213> Artificial Sequence <220> <223> DNA sequence of pCoryne-sgRNA vector without protospacer <400> 11 aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 60 tatttcgttc atccatagtt gcctgagaat tctaaagatc tttgacagct agctcagtcc 120 taggtataat actagtrtsa crbgttttag agctagaaat agcaagttaa aataaggcta 180 gtccgttatc aacttgaaaa agtggcaccg agtcggtgct ttttttgaag cttgggcccg 240 aacaaaaact catctcagaa gaggatctga atagcgccgt cgaccatcat catcatcatc 300 attgagttta aacggtctcc agcttggctg ttttggcgga tgagagaaga ttttcagcct 360 gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 420 tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 480 tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 540 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aactggatcc 600 gtcgacctgc agccaagctt ctgttttggc ggatgagaga agattttcag cctgatacag 660 attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg 720 gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt 780 gtggggtctc cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca 840 gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 900 gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc 960 aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc tgacggatgg 1020 cctttttgcg tttctacaaa ctcttttgtt tatttttcta aatacattca aatatgtatc 1080 cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 1140 gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 1200 ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 1260 tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 1320 aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgtg 1380 ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 1440 agtactgcgg cgtcgctgat cgccctggcg acgttgtgcg ggtggcttgt ccctgagggc 1500 gctgcgacag atagctaaaa atctgggtca ggatcgccgt agagcgcgcg tcgtcgattg 1560 gaggcttccc ctttggttga cggtcttcaa tcgctctacg gcgatcctga cgcttttttg 1620 ttgcgtaccg tcgatcgttt tatttctgtc gatcccgaaa aagtttttgc cttttgtaaa 1680 aaacttctcg gtcgccccgc aaattttcga ttccagattt tttaaaaacc aagccagaaa 1740 tacgacacac cgtttgcaga taatctgtct ttcggaaaaa tcaagtgcga tacaaaattt 1800 ttagcacccc tgagctgcgc aaagtcccgc ttcgtgaaaa ttttcgtgcc gcgtgatttt 1860 ccgccaaaaa ctttaacgaa cgttcgttat aatggtgtca tgaccttcac gacgaagtac 1920 taaaattggc ccgaatcatc agctatggat ctctctgatg tcgcgctgga gtccgacgcg 1980 ctcgatgctg ccgtcgattt aaaaacggtg atcggatttt tccgagctct cgatacgacg 2040 gacgcgccag catcacgaga ctgggccagt gccgcgagcg acctagaaac tctcgtggcg 2100 gatcttgagg agctggctga cgagctgcgt gctcggccag cgccaggagg acgcacagta 2160 gtggaggatg caatcagttg cgcctactgc ggtggcctga ttcctccccg gcctgacccg 2220 cgaggacggc gcgcaaaata ttgctcagat gcgtgtcgtg ccgcagccag ccgcgagcgc 2280 gccaacaaac gccacgccga ggagctggag gcggctaggt cgcaaatggc gctggaagtg 2340 cgtcccccga gcgaaatttt ggccatggtc gtcacagagc tggaagcggc agcgagaatt 2400 atccgcgatc gtggcgcggt gcccgcaggc atgacaaaca tcgtaaatgc cgcgtttcgt 2460 gtggccgtgg ccgcccagga cgtgtcagcg ccgccaccac ctgcaccgaa tcggcagcag 2520 cgtcgcgcgt cgaaaaagcg cacaggcggc aagaagcgat aagctgcacg aatacctgaa 2580 aaatgttgaa cgccccgtga gcggtaactc acagggcgtc ggctaacccc cagtccaaac 2640 ctgggagaaa gcgctcaaaa atgactctag cggattcacg agacattgac acaccggcct 2700 ggaaattttc cgctgatctg ttcgacaccc atcccgagct cgcgctgcga tcacgtggct 2760 ggacgagcga agaccgccgc aaattcctcg ctcacctggg cagagaaaat ttccagggca 2820 gcaagacccg cgacttcgcc agcgcttgga tcaaagaccc ggacacggga gaaacacagc 2880 cgaagttata ccgagttggt tcaaaatcgc ttgcccggtg ccagtatgtt gctctgacgc 2940 acgcgcagca cgcagccgtg cttgtcctgg acattgatgt gccgagccac caggccggcg 3000 ggaaaatcga gcacgtaaac cccgaggtct acgcgatttt ggagcgctgg gcacgcctgg 3060 aaaaagcgcc agcttggatc ggcgtgaatc cactgagcgg gaaatgccag ctcatctggc 3120 tcattgatcc ggtgtatgcc gcagcaggca tgagcagccc gaatatgcgc ctgctggctg 3180 caacgaccga ggaaatgacc cgcgttttcg gcgctgacca ggctttttca cataggctga 3240 gccgtggcca ctgcactctc cgacgatccc agccgtaccg ctggcatgcc cagcacaatc 3300 gcgtggatcg cctagctgat cttatggagg ttgctcgcat gatctcaggc acagaaaaac 3360 ctaaaaaacg ctatgagcag gagttttcta gcggacgggc acgtatcgaa gcggcaagaa 3420 aagccactgc ggaagcaaaa gcacttgcca cgcttgaagc aagcctgccg agcgccgctg 3480 aagcgtctgg agagctgatc gacggcgtcc gtgtcctctg gactgctcca gggcgtgccg 3540 cccgtgatga gacggctttt cgccacgctt tgactgtggg ataccagtta aaagcggctg 3600 gtgagcgcct aaaagacacc aagggtcatc gagcctacga gcgtgcctac accgtcgctc 3660 aggcggtcgg aggaggccgt gagcctgatc tgccgccgga ctgtgaccgc cagacggatt 3720 ggccgcgacg tgtgcgcggc tacgtcgcta aaggccagcc agtcgtccct gctcgtcaga 3780 cagagacgca gagccagccg aggcgaaaag ctctggccac tatgggaaga cgtggcggta 3840 aaaaggccgc agaacgctgg aaagacccaa acagtgagta cgcccgagca cagcgagaaa 3900 aactagctaa gtccagtcaa cgacaagcta ggaaagctaa aggaaatcgc ttgaccattg 3960 caggttggtt tatgactgtt gagggagaga ctggctcgtg gccgacaatc aatgaagcta 4020 tgtctgaatt tagcgtgtca cgtcagaccg tgaatagagc acttaaggtc tgcgggcatt 4080 gaacttccac gaggacgccg aaagcttccc agtaaatgtg ccatctcgta ggcagaaaac 4140 ggttcccccg tagggtctct ctcttggcct cctttctagg tcgggctgat tgctcttgaa 4200 gctctctagg ggggctcaca ccataggcag ataacgttcc ccaccggctc gcctcgtaag 4260 cgcacaagga ctgctcccaa agatcttcaa agccactgcc gcgactgcct tcgcgaagcc 4320 ttgccccgcg gaaatttcct ccaccgagtt cgtgcacacc cctatgccaa gcttctttca 4380 ccctaaattc gagagattgg attcttaccg tggaaattct tcgcaaaaat cgtcccctga 4440 tcgcccttgc gacgttggcg tcggtgccgc tggttgcgct tggcttgacc gacttgatcc 4500 tccggcgttc agcctgtgcc acagccgaca ggatggtgac caccatttgc cccatatcac 4560 cgtcggtact gatcccgtcg tcaataaacc gaaccgctac accctgagca tcaaactctt 4620 ttatcagttg gatcatgtcg gcgtgtcgcg gccaagacgg tcgagcttct tcaccagaat 4680 gacatcacct tcctccacct tcatcctcag caaatccagc ccttcccgat ctgttgaact 4740 gccggatgcc ttgtcggtaa agatgcggtt agcttttacc cctgcatctt tgagcgctga 4800 ggtctgcctc gtgaagaagg tgttgctgac tcataccagg cctgaatcgc cccatcatcc 4860 agccagaaag tgagggagcc acggttgatg agagctttgt tgtaggtgga ccagttggtg 4920 attttgaact tttgctttgc cacggaacgg tctgcgttgt cgggaagatg cgtgatctga 4980 tccttcaact cagcaaaagt tcgatttatt caacaaagcc gccgtcccgt caagtcagcg 5040 taatgctctg ccagtgttac aaccaattaa ccaattctga ttagaaaaac tcatcgagca 5100 tcaaatgaaa ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc 5160 gtttctgtaa tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt 5220 atcggtctgc gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa 5280 aaataaggtt atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca 5340 aaagcttatg catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa 5400 aatcactcgc atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata 5460 cgcgatcgct gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca 5520 ctgccagcgc atcagcaata ttttcacctg aatcaggata ttcttctaat acctggaatg 5580 ctgttttccc ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat 5640 gcttgatggt cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg 5700 taacatcatt ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct 5760 tcccatacaa tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat 5820 acccatataa atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc 5880 gttgaatatg gctcataaca ccccttgtat tactgtttat gtaagcagac agttttattg 5940 ttcatgatga tatattttta tcttgtgcaa tgtaacatca gagattttga gacacaacgt 6000 ggctttgttg aataaatcga acttttgctg agttgaagga tcagatcacg catcttcccg 6060 acaacgcaga ccgttccgtg gcaaagcaaa agttcaaaat caccaactgg tccacctaca 6120 acaaagctct catcaaccgt ggctccctca ctttctggct ggatgatggg gcgattcagg 6180 cctggtatga gtcagcaaca ccttcttcac gaggcagacc tcagcgctag cggagtgtat 6240 actggcttac tatgttggca ctgatgaggg tgtcagtgaa gtgcttcatg tggcaggaga 6300 aaaaaggctg caccggtgcg tcagcagaat atgtgataca ggatatattc cgcttcctcg 6360 ctcactgact cgctacgctc ggtcgttcga ctgcggcgag cggaaatggc ttacgaacgg 6420 ggcggagatt tcctggaaga tgccaggaag atacttaaca gggaagtgag agggccgcgg 6480 caaagccgtt tttccatagg ctccgccccc ctgacaagca tcacgaaatc tgacgctcaa 6540 atcagtggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggcggct 6600 ccctcgtgcg ctctcctgtt cctgcctttc ggtttaccgg tgtcattccg ctgttatggc 6660 cgcgtttgtc tcattccacg cctgacactc agttccgggt aggcagttcg ctccaagctg 6720 gactgtatgc acgaaccccc cgttcagtcc gaccgctgcg ccttatccgg taactatcgt 6780 cttgagtcca acccggaaag acatgcaaaa gcaccactgg cagcagccac tggtaattga 6840 tttagaggag ttagtcttga agtcatgcgc cggttaaggc taaactgaaa ggacaagttt 6900 tggtgactgc gctcctccaa gccagttacc tcggttcaaa gagttggtag ctcagagaac 6960 cttcgaaaaa ccgccctgca aggcggtttt ttcgttttca gagcaagaga ttacgcgcag 7020 accaaaacga tctcaagaag atcatcttat taaggggtct gacgctcagt ggaacgaaaa 7080 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 7140 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagt 7184 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer_1 sequence for idsA <400> 12 cagcccacgc ataaagagga 20 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer_2 sequence for idsA <400> 13 atttcccagc tgactgaatc 20 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer_1 sequence for ldh <400> 14 aatcggccca cacaacacca 20 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer_2 sequence for ldh <400> 15 atttccacac tgcgtaggtc 20 <210> 16 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer_3 sequence for ldh <400> 16 cgctcgattc cgctacatgc 20

Claims

132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 APOBEC1 또는 90 번째 아미노산이 트립토판에서 타이로신으로 치환되고 126 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 APOBEC1; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는, 염기 편집기 발현용 벡터로 형질전환된, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 균주로서,
상기 염기 편집기 발현용 벡터는 도 1의 모식도를 가지는 pCoryne-BE3-R132E 벡터 또는 pCoryne-YE1-BE3 벡터이고, 오프-타겟 효과를 억제하면서, 목적 유전자의 발현을 조기에 종결시키는 것을 특징으로 하는, 코리네박테리움 글루타미쿰 균주.

제1항에 있어서,
상기 재조합 APOBEC1는 서열번호 4 또는 서열번호 6의 아미노산 서열로 이루어진 것을 특징으로 하는, 코리네박테리움 글루타미쿰 균주.

제1항에 있어서,
상기 염기 편집기 발현용 벡터는 대장균에서의 발현을 위한 ColE 복제기점 서열 및 코리네박테리움 글루타미쿰에서의 발현을 위한 pBL1 복제기점 서열로 이루어진 군에서 선택된 1종 이상의 복제기점 서열을 더 포함하는 것을 특징으로 하는, 코리네박테리움 글루타미쿰 균주.

제1항에 있어서,
상기 코리네박테리움 글루타미쿰은 ATCC 13032 야생형 균주인 것을 특징으로 하는, 코리네박테리움 글루타미쿰 균주.

제1항에 있어서,
상기 염기 편집기 발현용 벡터는 코리네박테리움 글루타미쿰의 목적 유전자 내에서 글루타민 또는 아르지닌을 인코딩하는 코돈의 사이토신을 타이민으로 치환하여 종결코돈을 생성시킴으로써 목적 유전자의 발현을 조기에 종결시키는 것인, 코리네박테리움 글루타미쿰 균주.

제1항에 있어서,
상기 염기 편집기 발현용 벡터는 코리네박테리움 글루타미쿰의 목적 유전자 내에서 트립토판을 인코딩하는 코돈의 구아닌을 아데닌으로 치환하여 종결코돈을 생성시킴으로써 목적 유전자의 발현을 조기에 종결시키는 것인, 코리네박테리움 글루타미쿰 균주.

제1항에 있어서,
상기 목적 유전자는 idsA(geranylgeranyl pyrophosphate synthase) 또는 ldh(lactate dehydrogenase)인 것을 특징으로 하는, 코리네박테리움 글루타미쿰 균주.

제1항에 있어서,
상기 염기 편집기 발현용 벡터는 서열번호 1 또는 서열번호 2의 염기서열을 포함하는 것을 특징으로 하는, 코리네박테리움 글루타미쿰 균주.

제1항에 있어서,
상기 균주는 염기 편집기를 목적 유전자로 표적화하기 위한 가이드 RNA (sgRNA)를 인코딩하는 프로토스페이서 서열 및 이에 작동가능하게 연결된 프로모터를 포함하는 가이드 RNA 발현용 벡터에 의해 추가로 형질전환된 것인, 코리네박테리움 글루타미쿰 균주.

제9항에 있어서,
상기 가이드 RNA 발현용 벡터는 서열번호 11의 염기서열 및 상기 서열에 삽입된 프로토스페이서 서열을 포함하는 것을 특징으로 하는, 코리네박테리움 글루타미쿰 균주.

하기의 단계를 포함하는, 코리네박테리움 글루타미쿰에서 오프-타겟 효과를 억제하면서, 동시에 목적 유전자의 발현을 조기에 종결시키는 방법:
(a) 132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 APOBEC1 또는 90 번째 아미노산이 트립토판에서 타이로신으로 치환되고 126 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 APOBEC1; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는 염기 편집기 발현용 벡터, 및
상기 염기 편집기를 목적 유전자로 표적화하기 위한 가이드 RNA (sgRNA)를 인코딩하는 프로토스페이서 서열 및 이에 작동가능하게 연결된 프로모터를 포함하는, 가이드 RNA 발현용 벡터를 이용하여 코리네박테리움 글루타미쿰을 형질전환시키는 단계로서,
상기 염기 편집기 발현용 벡터는 도 1의 모식도를 가지는 pCoryne-BE3-R132E 벡터 또는 pCoryne-YE1-BE3 벡터인 것을 특징으로 하는, 단계; 및
(b) 상기 형질전환된 코리네박테리움 글루타미쿰을 배양하는 단계.

삭제

132 번째 아미노산이 아르지닌에서 글루탐산으로 치환된 재조합 APOBEC1; Cas9 니케이즈 (nCas9); 및 우라실 글라이코실레이즈 억제제 (UGI)를 각각 인코딩하는 유전자 및 이에 작동가능하게 연결된 프로모터를 포함하는 염기 편집기 발현용 벡터를 포함하는, 수탁번호 KCTC14257BP로 기탁된 대장균(Escherichia coli) 균주로서,
상기 염기 편집기 발현용 벡터는 도 1의 모식도를 가지는 pCoryne-BE3-R132E 벡터 또는 pCoryne-YE1-BE3 벡터이고, 오프-타겟 효과를 억제하면서, 목적 유전자의 발현을 조기에 종결시키는 것을 특징으로 하는, 대장균 균주.