KR20180083706A - 공통서열을 포함한 참조표준 게놈지도 구축 장치 및 방법 - Google Patents
공통서열을 포함한 참조표준 게놈지도 구축 장치 및 방법 Download PDFInfo
- Publication number
- KR20180083706A KR20180083706A KR1020170006310A KR20170006310A KR20180083706A KR 20180083706 A KR20180083706 A KR 20180083706A KR 1020170006310 A KR1020170006310 A KR 1020170006310A KR 20170006310 A KR20170006310 A KR 20170006310A KR 20180083706 A KR20180083706 A KR 20180083706A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- scaffold
- super
- genome
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G06F19/26—
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
| Library | Fraction | Ethnicity |
| CTB | 0.016 | Caucasian |
| CTC | 0.021 | Caucasian |
| CTD | 0.043 | East Asian |
| RP1 | 0.028 | Caucasian |
| RP3 | 0.016 | Caucasian |
| RP4 | 0.022 | Caucasian |
| RP5 | 0.027 | Caucasian |
| RP11 | 0.743 | Caucasian/African |
| total | 0.916 |
| 게놈지도 | 게놈 해독 방식 | 참고논문 |
| GRCh38 |
인간게놈지도. BAC라이브를 구축하여, Sanger 해독방식으로 게놈해독 및 조립됨 | Lander, E. S. et al. Initial sequencing and analysis of the human genome. Nature 409, 860921 (2001). |
| AK1 |
PacBio 긴서열 및 BioNano 맵으로 조립 |
Seo, J. S. et al. De novo assembly and phasing of a Korean human genome. Nature 538, 243247 (2016). |
| HX1 |
PacBio 긴서열 및 BioNano map으로 조립 |
Shi, L. et al. Long-read sequencing and de novo assembly of a Chinese genome. Nat. Commun. 7, 12065 (2016). |
| ASM101398v1 |
PacBio 긴서열 및 BioNano map으로 조립 |
Pendleton, M. et al. Assembly and diploid architecture of an individual human genome via single-molecule technologies. Nat. Methods 12, 780786 (2015). |
| CHM1_PacBio_r2 |
PacBio 긴서열로 조립 |
Chaisson, M. J. et al. Resolving the complexity of the human genome using single-molecule sequencing. Nature 517, 608611 (2015). |
| HsapALLPATHS1 |
NGS 방식으로 해독 조립 |
Gnerre, S. et al. High-quality draft assemblies of mammalian genomes from massively parallel sequence data. Proc. Natl Acad. Sci. USA 108, 15131518(2011). |
| HuRef |
생어해독방식으로 조립 |
Levy, S. et al. The diploid genome sequence of an individual human. PLoS Biol. 5, e254 (2007). |
| Mongolian |
NGS 방식으로 해독 조립 |
Bai, H. et al. The genome of a Mongolian individual reveals the genetic imprints of Mongolians on modern human populations. Genome Biol. Evol. 6, 31223136 (2014). |
| YH / YH_2.0 | NGS 방식으로 해독 조립 | Li, R. et al. De novo assembly of human genomes with massively parallel short read sequencing. Genome Res. 20, 265272 (2010). |
| African | NGS 방식으로 해독 조립 |
도 2는 본 발명의 바람직한 실시예에 따른 참조표준 게놈지도 구축 과정의 일례를 설명하기 위한 도면이다.
도 3은 본 발명의 바람직한 실시예에 따른 슈퍼-스캐폴드의 검증 결과의 일례를 설명하기 위한 도면이다.
도 4는 본 발명의 바람직한 실시예에 따른 염색체 서열의 조립 결과의 일례를 설명하기 위한 도면이다.
도 5는 본 발명의 바람직한 실시예에 따른 참조표준 게놈 지도의 효과를 설명하기 위한 그래프이다.
도 6은 본 발명의 바람직한 실시예에 따른 공통서열을 포함한 참조표준 게놈지도 구축 방법을 설명하기 위한 흐름도이다.
도 7은 도 6에 도시한 서열 필터링 단계를 보다 자세히 나타낸 흐름도이다.
도 8은 도 6에 도시한 컨티그 조립 단계를 보다 자세히 나타낸 흐름도이다.
도 9는 도 6에 도시한 스캐폴드 조립 단계를 보다 자세히 나타낸 흐름도이다.
도 10은 도 6에 도시한 슈퍼-스캐폴드 조립 단계를 보다 자세히 나타낸 흐름도이다.
| Type | Insert size | Read length (bp) | Number of read pairs | Total data (Gb) | Sequence depth (X) | |
| Short-insert size libraries |
170bp |
101 |
254,562,947 | 51.42 | 16.59 | 48.69 |
| 246,624,330 | 49.82 | 16.07 | ||||
| 246,007,078 | 49.70 | 16.03 | ||||
| 500bp |
101 |
246,418,836 | 49.78 | 16.06 | 46.71 |
|
| 230,109,465 | 46.48 | 14.99 | ||||
| 240,361,539 | 48.55 | 15.66 | ||||
| 700bp |
101 |
207,193,678 | 41.85 | 13.50 | 39.17 |
|
| 188,159,956 | 38.01 | 12.26 | ||||
| 205,873,335 | 41.59 | 13.41 | ||||
| Long-mate pair libraries |
2Kb |
101 |
196,290,337 | 39.65 | 12.79 | 38.22 |
| 232,858,099 | 47.04 | 15.17 | ||||
| 157,507,662 | 31.82 | 10.26 | ||||
| 5Kb |
101 |
152,201,289 | 30.74 | 9.92 | 32.81 |
|
| 177,874,430 | 35.93 | 11.59 | ||||
| 173,383,733 | 35.02 | 11.30 | ||||
| 10Kb |
101 |
205,215,277 | 41.45 | 13.37 | 40.05 |
|
| 209,859,354 | 42.39 | 13.67 | ||||
| 199,617,521 | 40.32 | 13.01 | ||||
| 15Kb |
101 |
156,336,183 | 31.58 | 10.19 | 30.65 |
|
| 166,036,249 | 33.54 | 10.82 | ||||
| 147,927,209 | 29.88 | 9.64 | ||||
| 20Kb |
101 |
181,506,276 | 36.66 | 11.83 | 34.72 |
|
| 177,434,679 | 35.84 | 11.56 | ||||
| 173,929,946 | 35.13 | 11.33 | ||||
| Total | 4,773,289,408 | 964.19 | 311.02 | 311.02 | ||
| Type | Insert size | Read length (bp) | Number of read pairs | Total data (Gb) | Sequence Depth (X) | |
| Short-insert size libraries |
170bp |
90 |
238,901,578 | 43.00 | 13.87 | 40 |
| 225,934,916 | 40.67 | 13.12 | ||||
| 224,145,725 | 40.35 | 13.01 | ||||
| 500bp |
90 |
220,100,704 | 39.62 | 12.78 | 37.57 |
|
| 207,716,033 | 37.39 | 12.06 | ||||
| 219,165,329 | 39.45 | 12.73 | ||||
| 700bp |
90 |
189,043,000 | 34.03 | 10.98 | 32.24 |
|
| 173,545,699 | 31.24 | 10.08 | ||||
| 192,535,557 | 34.66 | 11.18 | ||||
| Long-mate pair libraries |
2Kb |
49 |
102,368,796 | 10.03 | 3.24 | 9.64 |
| 118,485,351 | 11.61 | 3.75 | ||||
| 83,704,400 | 8.20 | 2.65 | ||||
| 5Kb |
49 |
74,199,538 | 7.27 | 2.35 | 8.08 |
|
| 93,060,115 | 9.12 | 2.94 | ||||
| 88,156,446 | 8.64 | 2.79 | ||||
| 10Kb |
49 |
52,521,514 | 5.15 | 1.66 | 5.03 |
|
| 54,759,429 | 5.37 | 1.73 | ||||
| 51,874,811 | 5.08 | 1.64 | ||||
| 15Kb |
49 |
60,904,413 | 5.97 | 1.93 | 5.3 |
|
| 55,631,632 | 5.45 | 1.76 | ||||
| 51,042,581 | 5.00 | 1.61 | ||||
| 20Kb |
49 |
20,374,949 | 2.00 | 0.64 | 2.08 |
|
| 26,561,512 | 2.60 | 0.84 | ||||
| 19,032,195 | 1.87 | 0.60 | ||||
| Total | 2,843,766,223 | 433.77 | 139.94 | 139.94 | ||
| Insert Size | Library |
Error corrected
bases ratio |
| 170bp |
KR01_PE_170_L1_1 | 0.0569% |
| KR01_PE_170_L1_2 | 0.0640% | |
| KR01_PE_170_L2_1 | 0.0725% | |
| KR01_PE_170_L2_2 | 0.1675% | |
| KR01_PE_170_L3_1 | 0.0716% | |
| KR01_PE_170_L3_2 | 0.1715% | |
| 500bp |
KR01_PE_500_L1_1 | 0.0729% |
| KR01_PE_500_L1_2 | 0.2081% | |
| KR01_PE_500_L2_1 | 0.0684% | |
| KR01_PE_500_L2_2 | 0.1718% | |
| KR01_PE_500_L3_1 | 0.0840% | |
| KR01_PE_500_L3_2 | 0.1615% | |
| 700bp |
KR01_PE_700_L1_1 | 0.1074% |
| KR01_PE_700_L1_2 | 0.2794% | |
| KR01_PE_700_L2_1 | 0.1182% | |
| KR01_PE_700_L2_2 | 0.2401% | |
| KR01_PE_700_L3_1 | 0.0757% | |
| KR01_PE_700_L3_2 | 0.2625% |
| K-mer size | All sequences | Longer than 100 bp | ||||
| Total size | Longest | N50 | Total size | Longest | N50 | |
| 29 | 5,187,304,717 | 16,946 | 90 | 2,275,359,750 | 16,946 | 1,099 |
| 39 | 4,459,796,947 | 35,726 | 300 | 2,529,816,579 | 35,726 | 1,939 |
| 49 | 4,066,593,737 | 51,838 | 980 | 2,740,134,913 | 51,838 | 2,375 |
| 55 | 3,860,731,497 | 44,789 | 1,447 | 2,915,054,629 | 44,789 | 2,559 |
| 59 | 3,744,446,380 | 48,982 | 1,773 | 2,990,197,206 | 48,982 | 2,735 |
| 63 | 3,641,677,654 | 54,683 | 2,113 | 3,029,961,853 | 54,683 | 2,964 |
| 69 | 3,524,281,519 | 54,689 | 2,589 | 3,072,247,309 | 54,689 | 3,295 |
| 75 | 3,429,622,648 | 62,488 | 2,918 | 3,097,380,667 | 62,488 | 3,466 |
| 79 | 3,343,414,611 | 80,399 | 2,789 | 3,086,359,621 | 80,399 | 3,187 |
| Scaffold | ||
| Size (Mb) | No. | |
| N90 | 3.09 | 178 |
| N80 | 6.45 | 116 |
| N70 | 10.45 | 81 |
| N60 | 16.16 | 59 |
| N50 | 19.85 | 42 |
| Longest | 81.91 | - |
| Gaps | 1.65 % | - |
| Total (≥ 200bp) | 2.92 Gb | 68,170 |
| Total (≥10 Kb) | 2.88 Gb | 1,243 |
| Enzyme | Usable% 5Kb-20Kb | Usable% 6Kb-15Kb | Usable% 6Kb - 12Kb | Ave. Frags size (kb) | # of Frags > 100kb | Max Frag size (Kb) |
| AflII | 25.12 | 10.31 | 10.07 | 4.58 | 4 | 117.49 |
| BamHI | 94.94 | 82.36 | 72.76 | 8.08 | 19 | 159.82 |
| KpnI | 98.76 | 91.89 | 69.64 | 10.35 | 50 | 154.09 |
| NcoI | 17.1 | 3.37 | 3.35 | 3.85 | 0 | 84.46 |
| NheI | 98.08 | 89.26 | 65.1 | 10.67 | 62 | 149.61 |
| SpeI | 94.8 | 73.17 | 67.9 | 7.44 | 63 | 196.12 |
| BglII | 7.01 | 2.12 | 2.07 | 3.79 | 1 | 104.69 |
| EcoRI | 7.86 | 2.87 | 2.85 | 3.65 | 0 | 71.37 |
| MluI | 0.76 | 0.23 | 0.09 | 130.62 | 9422 | 1529.97 |
| NdeI | 12.35 | 6.4 | 6.21 | 3.25 | 3 | 105.73 |
| PvuII | 2.2 | 0.4 | 0.4 | 2.7 | 3 | 149.7 |
| XbaI | 9.27 | 3.33 | 3.26 | 3.64 | 3 | 147.38 |
| XhoI | 26.46 | 11.1 | 4.88 | 23.64 | 2612 | 372.38 |
| Summary of SMRM data | Maps used in analysis |
| Total Size (Gb) | 745.51 |
| Number of Molecules | 2,071,951 |
| Average Size of Molecules (Kb) | 359.81 |
| Minimum molecule size (Kb) | 250 |
| Average Size of Fragments (Kb) | 13.24 |
|
Whole-genome
optical mapping을 활용한 super-scaffold 조립결과 |
||
| Size (Mb) | No. | |
| N90 | 3.86 | 140 |
| N80 | 9.45 | 92 |
| N70 | 14.47 | 67 |
| N60 | 19.56 | 49 |
| N50 | 25.93 | 36 |
| Longest | 101.22 | - |
| Gaps | 1.75 % | - |
| Total (≥ 200bp) | 2.92 Gb | 68,103 |
| Total (≥10 Kb) | 2.88 Gb | 1,176 |
| Size | Number of bases (bp) | Number of reads | Mean length (bp) |
| ~2kb | 2,200,375,125 | 2,023,326 | 1,088 |
| ~3kb | 2,598,138,881 | 1,054,927 | 2,463 |
| ~4kb | 2,253,729,183 | 650,819 | 3,463 |
| ~5kb | 1,993,913,569 | 445,503 | 4,476 |
| ~6kb | 1,868,335,867 | 341,037 | 5,478 |
| ~7kb | 1,692,679,373 | 261,244 | 6,479 |
| ~8kb | 1,490,151,540 | 199,293 | 7,477 |
| ~9kb | 1,264,147,938 | 149,166 | 8,475 |
| ~10kb | 1,025,254,470 | 108,261 | 9,470 |
| 10kb~ | 2,404,653,532 | 202,921 | 11,850 |
| Total | 18,791,379,478 | 5,436,497 | 3,457 |
| Region | Number of bases (bp) | Number of reads | Mean length (bp) |
| ~2kb | 376,691,922 | 352,650 | 1,068 |
| ~3kb | 448,189,058 | 179,744 | 2,493 |
| ~4kb | 581,090,138 | 166,158 | 3,497 |
| ~5kb | 707,030,086 | 157,272 | 4,496 |
| ~6kb | 815,006,427 | 148,315 | 5,495 |
| ~7kb | 905,881,157 | 139,481 | 6,495 |
| ~8kb | 978,965,060 | 130,607 | 7,496 |
| ~9kb | 1,063,290,046 | 125,158 | 8,496 |
| ~10kb | 1,084,089,752 | 114,232 | 9,490 |
| 10kb~ | 5,347,185,274 | 406,019 | 13,170 |
| Total | 12,307,418,920 | 1,919,636 | 6,411 |
| Region | Number of bases (bp) | Number of reads | Mean length (bp) |
| ~2kb | 1,745,885,089 | 1,627,362 | 1,073 |
| ~3kb | 1,227,839,348 | 498,112 | 2,465 |
| ~4kb | 1,200,052,670 | 345,449 | 3,474 |
| ~5kb | 1,170,624,980 | 261,313 | 4,480 |
| ~6kb | 1,141,935,546 | 208,259 | 5,483 |
| ~7kb | 1,132,652,780 | 174,578 | 6,488 |
| ~8kb | 1,358,992,691 | 181,044 | 7,506 |
| ~9kb | 2,532,232,743 | 294,819 | 8,589 |
| ~10kb | 2,879,791,577 | 304,656 | 9,453 |
| 10kb~ | 1,910,098,184 | 181,128 | 10,546 |
| Total | 16,300,105,608 | 4,076,720 | 3,998 |
|
긴서열을
활용한 갭
클로징
(gap closing)
(PacBio and TSLR ) |
||
| Size (Mb) | No. | |
| N90 | 3.53 | 143 |
| N80 | 9.26 | 93 |
| N70 | 14.53 | 67 |
| N60 | 19.36 | 50 |
| N50 | 26.08 | 36 |
| Longest | 101.48 | - |
| Gaps | 1.06 % | - |
| Total (≥ 200bp) | 2.94 Gb | 68,451 |
| Total (≥10 Kb) | 2.90 Gb | 1,369 |
| BioNano single molcules | BioNano consensus maps | |
| Total data | 210 Gb | - |
| Single molecule N50 | 273 Kb | - |
| Moleulces above 150Kb | 145 Gb | - |
| Coverage depth | 45 × | - |
| Assembly size | - | 2.78 Gb |
| Consensus map N50 | - | 1.12 Mb |
|
Chromosomes
*Unplaced scaffolds were excluded. |
||
| Size (Mb) | No. | |
| N90 | 81.54 | 19 |
| N80 | 103.05 | 16 |
| N70 | 136.43 | 13 |
| N60 | 137.59 | 11 |
| N50 | 155.88 | 8 |
| Longest | 251.92 | - |
| Gaps | 9.44 % | - |
| Total (≥ 200bp) | 3.12 Gb | 24 |
| Total (≥10 Kb) | 3.12 Gb | 24 |
| Sample ID |
Total number of
raw reads |
Mapped
read depth (except 'N') |
Read mapping
rate ( % ) |
Homozygous
SNVs |
Homozygous
INDELs |
Heterozygous
SNVs |
Heterozygous
INDELs |
All
variants |
| KPGP-00002 | 98,317,515,960 | 27.64 | 99.29 | 962,066 | 146,462 | 2,958,707 | 292,082 | 4,359,317 |
| KPGP-00006 | 93,448,081,980 | 24.73 | 99.28 | 1,431,527 | 204,234 | 2,915,971 | 276,219 | 4,827,951 |
| KPGP-00032 | 112,190,946,660 | 30.36 | 99.29 | 1,444,163 | 215,475 | 2,955,815 | 296,145 | 4,911,598 |
| KPGP-00033 | 108,196,466,760 | 29.95 | 99.30 | 1,406,058 | 211,651 | 2,961,708 | 297,035 | 4,876,452 |
| KPGP-00039 | 101,141,448,400 | 30.19 | 99.16 | 1,391,102 | 212,028 | 2,991,047 | 315,678 | 4,909,855 |
| KPGP-00056 | 111,361,334,200 | 32.24 | 99.34 | 1,419,373 | 230,317 | 3,100,438 | 340,429 | 5,090,557 |
| KPGP-00086 | 102,626,322,600 | 29.88 | 99.34 | 1,423,097 | 228,216 | 3,074,640 | 335,156 | 5,061,109 |
| KPGP-00125 | 118,670,365,980 | 33.12 | 99.31 | 1,438,747 | 211,687 | 2,932,733 | 291,074 | 4,874,241 |
| KPGP-00127 | 118,883,354,760 | 32.81 | 99.33 | 1,416,527 | 206,959 | 2,948,523 | 288,104 | 4,860,113 |
| KPGP-00128 | 117,849,278,700 | 32.76 | 99.29 | 1,407,530 | 208,532 | 2,941,634 | 292,805 | 4,850,501 |
| KPGP-00129 | 107,124,150,780 | 29.96 | 99.28 | 1,440,746 | 203,979 | 2,908,731 | 271,108 | 4,824,564 |
| KPGP-00131 | 120,142,829,340 | 33.36 | 99.29 | 1,432,319 | 211,261 | 2,970,372 | 289,604 | 4,903,556 |
| KPGP-00132 | 122,237,363,160 | 33.93 | 99.30 | 1,411,276 | 210,946 | 2,946,694 | 297,988 | 4,866,904 |
| KPGP-00134 | 119,540,641,320 | 32.54 | 99.28 | 1,416,157 | 207,904 | 2,931,855 | 288,305 | 4,844,221 |
| KPGP-00136 | 114,984,689,940 | 30.71 | 99.30 | 1,429,777 | 204,804 | 2,940,492 | 274,170 | 4,849,243 |
| KPGP-00137 | 118,027,255,140 | 32.97 | 99.28 | 1,403,331 | 207,581 | 2,940,643 | 289,256 | 4,840,811 |
| KPGP-00138 | 123,868,546,380 | 33.39 | 99.32 | 1,398,902 | 207,327 | 2,938,964 | 289,045 | 4,834,238 |
| KPGP-00139 | 105,730,760,700 | 29.32 | 99.28 | 1,397,287 | 207,216 | 2,918,240 | 291,707 | 4,814,450 |
| KPGP-00141 | 111,508,577,820 | 31.41 | 99.24 | 1,405,400 | 207,892 | 2,926,108 | 288,957 | 4,828,357 |
| KPGP-00142 | 125,024,326,200 | 32.62 | 99.29 | 1,443,241 | 211,075 | 2,943,175 | 292,818 | 4,890,309 |
| KPGP-00144 | 127,001,127,600 | 33.96 | 99.30 | 1,422,369 | 211,512 | 2,973,541 | 296,396 | 4,903,818 |
| KPGP-00145 | 111,861,808,380 | 31.18 | 99.29 | 1,438,003 | 210,730 | 2,953,375 | 293,052 | 4,895,160 |
| KPGP-00205-B01-G | 123,835,438,866 | 37.24 | 98.41 | 1,422,423 | 221,835 | 3,072,207 | 332,313 | 5,048,778 |
| KPGP-00220 | 106,317,727,560 | 28.21 | 99.28 | 1,411,132 | 201,485 | 2,931,702 | 284,397 | 4,828,716 |
| KPGP-00227 | 115,164,844,920 | 34.39 | 99.30 | 1,419,518 | 217,159 | 3,039,274 | 308,248 | 4,984,199 |
| KPGP-00228 | 112,898,405,520 | 33.34 | 99.30 | 1,455,818 | 221,343 | 3,052,488 | 303,008 | 5,032,657 |
| KPGP-00230 | 110,458,697,940 | 32.86 | 99.31 | 1,414,415 | 214,448 | 3,031,789 | 301,182 | 4,961,834 |
| KPGP-00232 | 109,620,112,860 | 32.01 | 99.29 | 1,442,223 | 214,897 | 3,020,544 | 292,548 | 4,970,212 |
| KPGP-00233 | 107,091,428,940 | 32.08 | 99.27 | 1,421,451 | 216,917 | 3,014,334 | 302,473 | 4,955,175 |
| KPGP-00235 | 114,400,539,900 | 34.74 | 99.31 | 1,414,391 | 218,911 | 3,047,216 | 309,518 | 4,990,036 |
| KPGP-00245-B01-G-PE500 | 102,078,086,860 | 31.40 | 99.11 | 1,465,527 | 223,235 | 3,031,190 | 322,301 | 5,042,253 |
| KPGP-00254 | 122,277,928,000 | 34.56 | 99.24 | 1,427,301 | 221,720 | 3,080,569 | 313,709 | 5,043,299 |
| KPGP-00255 | 102,221,657,600 | 29.67 | 99.34 | 1,414,140 | 227,857 | 3,083,228 | 336,527 | 5,061,752 |
| KPGP-00256 | 127,033,362,000 | 36.61 | 99.35 | 1,422,753 | 235,874 | 3,174,628 | 355,538 | 5,188,793 |
| KPGP-00265-B01-G-P500 | 90,922,729,400 | 27.53 | 99.29 | 1,414,977 | 216,811 | 2,964,359 | 306,126 | 4,902,273 |
| KPGP-00266-B01-G-P500 | 91,666,078,800 | 27.38 | 99.32 | 1,374,215 | 212,665 | 2,962,424 | 307,516 | 4,856,820 |
| KPGP-00269-B01-G-PE500 | 100,240,975,874 | 30.81 | 99.32 | 1,449,250 | 219,822 | 3,052,622 | 324,886 | 5,046,580 |
| KPGP-00317-B01-G-PE500 | 103,075,371,660 | 26.76 | 87.15 | 1,400,454 | 208,300 | 3,002,602 | 306,055 | 4,917,411 |
| KPGP-00318-B01-G-PE500 | 101,805,865,370 | 28.22 | 95.42 | 1,440,304 | 218,383 | 2,971,844 | 319,451 | 4,949,982 |
| KPGP-00319-B01-G-PE500 | 100,957,938,100 | 27.77 | 97.17 | 1,403,626 | 213,564 | 3,063,114 | 315,785 | 4,996,089 |
| Sample ID |
Total amount of
raw reads |
Mapped
read depth (except 'N') |
Read mapping
rate (%) |
Homozygous
SNP |
Homozygous
INDEL |
Heterozygous
SNP |
Heterozygous
INDEL |
All
variants |
| KPGP-00002 | 98,317,515,960 | 27.64 | 99.29 | 962,066 | 146,462 | 2,958,707 | 292,082 | 4,359,317 |
| KPGP-00006 | 93,448,081,980 | 24.73 | 99.28 | 1,431,527 | 204,234 | 2,915,971 | 276,219 | 4,827,951 |
| KPGP-00032 | 112,190,946,660 | 30.36 | 99.29 | 1,444,163 | 215,475 | 2,955,815 | 296,145 | 4,911,598 |
| KPGP-00033 | 108,196,466,760 | 29.95 | 99.30 | 1,406,058 | 211,651 | 2,961,708 | 297,035 | 4,876,452 |
| KPGP-00039 | 101,141,448,400 | 30.19 | 99.16 | 1,391,102 | 212,028 | 2,991,047 | 315,678 | 4,909,855 |
| KPGP-00056 | 111,361,334,200 | 32.24 | 99.34 | 1,419,373 | 230,317 | 3,100,438 | 340,429 | 5,090,557 |
| KPGP-00086 | 102,626,322,600 | 29.88 | 99.34 | 1,423,097 | 228,216 | 3,074,640 | 335,156 | 5,061,109 |
| KPGP-00125 | 118,670,365,980 | 33.12 | 99.31 | 1,438,747 | 211,687 | 2,932,733 | 291,074 | 4,874,241 |
| KPGP-00127 | 118,883,354,760 | 32.81 | 99.33 | 1,416,527 | 206,959 | 2,948,523 | 288,104 | 4,860,113 |
| KPGP-00128 | 117,849,278,700 | 32.76 | 99.29 | 1,407,530 | 208,532 | 2,941,634 | 292,805 | 4,850,501 |
| KPGP-00129 | 107,124,150,780 | 29.96 | 99.28 | 1,440,746 | 203,979 | 2,908,731 | 271,108 | 4,824,564 |
| KPGP-00131 | 120,142,829,340 | 33.36 | 99.29 | 1,432,319 | 211,261 | 2,970,372 | 289,604 | 4,903,556 |
| KPGP-00132 | 122,237,363,160 | 33.93 | 99.30 | 1,411,276 | 210,946 | 2,946,694 | 297,988 | 4,866,904 |
| KPGP-00134 | 119,540,641,320 | 32.54 | 99.28 | 1,416,157 | 207,904 | 2,931,855 | 288,305 | 4,844,221 |
| KPGP-00136 | 114,984,689,940 | 30.71 | 99.30 | 1,429,777 | 204,804 | 2,940,492 | 274,170 | 4,849,243 |
| KPGP-00137 | 118,027,255,140 | 32.97 | 99.28 | 1,403,331 | 207,581 | 2,940,643 | 289,256 | 4,840,811 |
| KPGP-00138 | 123,868,546,380 | 33.39 | 99.32 | 1,398,902 | 207,327 | 2,938,964 | 289,045 | 4,834,238 |
| KPGP-00139 | 105,730,760,700 | 29.32 | 99.28 | 1,397,287 | 207,216 | 2,918,240 | 291,707 | 4,814,450 |
| KPGP-00141 | 111,508,577,820 | 31.41 | 99.24 | 1,405,400 | 207,892 | 2,926,108 | 288,957 | 4,828,357 |
| KPGP-00142 | 125,024,326,200 | 32.62 | 99.29 | 1,443,241 | 211,075 | 2,943,175 | 292,818 | 4,890,309 |
| KPGP-00144 | 127,001,127,600 | 33.96 | 99.30 | 1,422,369 | 211,512 | 2,973,541 | 296,396 | 4,903,818 |
| KPGP-00145 | 111,861,808,380 | 31.18 | 99.29 | 1,438,003 | 210,730 | 2,953,375 | 293,052 | 4,895,160 |
| KPGP-00205-B01-G | 123,835,438,866 | 37.24 | 98.41 | 1,422,423 | 221,835 | 3,072,207 | 332,313 | 5,048,778 |
| KPGP-00220 | 106,317,727,560 | 28.21 | 99.28 | 1,411,132 | 201,485 | 2,931,702 | 284,397 | 4,828,716 |
| KPGP-00227 | 115,164,844,920 | 34.39 | 99.30 | 1,419,518 | 217,159 | 3,039,274 | 308,248 | 4,984,199 |
| KPGP-00228 | 112,898,405,520 | 33.34 | 99.30 | 1,455,818 | 221,343 | 3,052,488 | 303,008 | 5,032,657 |
| KPGP-00230 | 110,458,697,940 | 32.86 | 99.31 | 1,414,415 | 214,448 | 3,031,789 | 301,182 | 4,961,834 |
| KPGP-00232 | 109,620,112,860 | 32.01 | 99.29 | 1,442,223 | 214,897 | 3,020,544 | 292,548 | 4,970,212 |
| KPGP-00233 | 107,091,428,940 | 32.08 | 99.27 | 1,421,451 | 216,917 | 3,014,334 | 302,473 | 4,955,175 |
| KPGP-00235 | 114,400,539,900 | 34.74 | 99.31 | 1,414,391 | 218,911 | 3,047,216 | 309,518 | 4,990,036 |
| KPGP-00245-B01-G-PE500 | 102,078,086,860 | 31.40 | 99.11 | 1,465,527 | 223,235 | 3,031,190 | 322,301 | 5,042,253 |
| KPGP-00254 | 122,277,928,000 | 34.56 | 99.24 | 1,427,301 | 221,720 | 3,080,569 | 313,709 | 5,043,299 |
| KPGP-00255 | 102,221,657,600 | 29.67 | 99.34 | 1,414,140 | 227,857 | 3,083,228 | 336,527 | 5,061,752 |
| KPGP-00256 | 127,033,362,000 | 36.61 | 99.35 | 1,422,753 | 235,874 | 3,174,628 | 355,538 | 5,188,793 |
| KPGP-00265-B01-G-P500 | 90,922,729,400 | 27.53 | 99.29 | 1,414,977 | 216,811 | 2,964,359 | 306,126 | 4,902,273 |
| KPGP-00266-B01-G-P500 | 91,666,078,800 | 27.38 | 99.32 | 1,374,215 | 212,665 | 2,962,424 | 307,516 | 4,856,820 |
| KPGP-00269-B01-G-PE500 | 100,240,975,874 | 30.81 | 99.32 | 1,449,250 | 219,822 | 3,052,622 | 324,886 | 5,046,580 |
| KPGP-00317-B01-G-PE500 | 103,075,371,660 | 26.76 | 87.15 | 1,400,454 | 208,300 | 3,002,602 | 306,055 | 4,917,411 |
| KPGP-00318-B01-G-PE500 | 101,805,865,370 | 28.22 | 95.42 | 1,440,304 | 218,383 | 2,971,844 | 319,451 | 4,949,982 |
| KPGP-00319-B01-G-PE500 | 100,957,938,100 | 27.77 | 97.17 | 1,403,626 | 213,564 | 3,063,114 | 315,785 | 4,996,089 |
| SNVs | indels | Total |
| 1,951,986 | 219,728 | 2,171,714 |
| Scaffold |
Whole-genome
optical mapping |
Super-scaffold
(Long reads) |
Chromosomes
(Assessment using BioNano maps) |
|||||
|
Size
(Mb) |
No. |
Size
(Mb) |
No. |
Size
(Mb) |
No. |
Size
(Mb) |
No. | |
| N90 | 3.09 | 178 | 3.86 | 140 | 3.53 | 143 | 81.54 | 19 |
| N80 | 6.45 | 116 | 9.45 | 92 | 9.26 | 93 | 103.05 | 16 |
| N70 | 10.45 | 81 | 14.47 | 67 | 14.53 | 67 | 136.43 | 13 |
| N60 | 16.16 | 59 | 19.56 | 49 | 19.36 | 50 | 137.59 | 11 |
| N50 | 19.85 | 42 | 25.93 | 36 | 26.08 | 36 | 155.88 | 8 |
| Longest | 81.91 | - | 101.22 | - | 101.48 | - | 251.92 | - |
| Gaps | 1.65 % | - | 1.75 % | - | 1.06 % | - | 9.44 % | - |
| Total (≥ 200bp) |
2.92 Gb | 68,170 | 2.92 Gb | 68,103 | 2.94 Gb | 68,451 | 3.12 Gb | 24 |
| Total (≥10 Kb) |
2.88 Gb | 1,243 | 2.88 Gb | 1,176 | 2.90 Gb | 1,369 | 3.12 Gb | 24 |
| 게놈지도 | 조립서열 길이(bp) |
스캐폴드/컨티그
N50 (Mb) |
인간게놈지도
( GRCh38 ) 복원율 (%) |
단편중복(segmental duplication) 영역 | 반복(repeat) 서열 | NCBI 유전자 복원 | |||
| 길이(bp) | % | 길이(bp) | % | 수 | % | ||||
| 인간게놈지도 GRCh38 (염색체) |
3,209,286,105 | 67.79 | - | 212,777,868 | - | 1,564,209,365 | - | 20,135 | - |
| KOREF (염색체) | 3,211,075,818 | 26.46 | 88.47 | 149,353,191 | 70.19 | 1,452,404,484 | 92.85 | 17,758 | 88.19 |
| AK1 | 2,904,207,228 | 44.85 | 87.90 | 144,868,735 | 68.08 | 1,454,888,506 | 93.01 | 17,759 | 88.20 |
| CHM1_PacBio_r2 | 2,996,426,293 | 26.90 | 88.02 | 205,559,250 | 96.61 | 1,541,211,387 | 98.53 | 17,657 | 87.69 |
| ASM101398v1 | 3,176,574,379 | 26.83 | 88.26 | 168,652,649 | 79.26 | 1,545,168,387 | 98.78 | 6,610 | 32.83 |
| HsapALLPATHS1 | 2,786,258,565 | 12.08 | 82.89 | 90,343,965 | 42.46 | 1,250,655,296 | 79.95 | 16,995 | 84.41 |
| HuRef (염색체) | 2,844,000,504 | 17.66 | 85.85 | 134,317,812 | 63.13 | 1,411,487,301 | 90.24 | 16,968 | 84.27 |
| Mongolian | 2,881,945,563 | 7.63 | 86.54 | 121,384,034 | 57.05 | 1,399,420,366 | 89.47 | 17,189 | 85.37 |
| YH_2.0 | 2,911,235,363 | 20.52 | 86.31 | 127,254,909 | 59.81 | 1,397,013,571 | 89.31 | 17,125 | 85.05 |
| African | 2,676,008,911 | 0.062 | 69.47 | 55,830,170 | 26.24 | 968,988,149 | 61.95 | 9,167 | 45.53 |
120 : 서열 필터링부, 130 : 컨티그 조립부,
140 : 스캐폴드 조립부, 150 : 슈퍼-스캐폴드 조립부,
160 : 염색체 서열 조립부, 170 : 서열 치환부
Claims (17)
- NGS(next generation sequencing)를 이용하여 미리 설정된 값보다 작은 단편 크기(insert size)를 가지는 단서열과 상기 미리 설정된 값보다 큰 단편 크기(insert size)를 가지는 긴짝서열을 생산하는 서열 생산부;
상기 단서열과 상기 긴짝서열에서 미리 설정된 리드(read)를 필터링하는 서열 필터링부;
드 부루인(De Bruijn) 그래프를 이용하여 상기 단서열을 기반으로 컨티그(contig)를 조립하는 컨티그 조립부;
상기 컨티그와 상기 긴짝서열을 기반으로 스캐폴드(scaffold)를 조립하는 스캐폴드 조립부;
단일 분자 지도(single molecule map)와 상기 스캐폴드(scaffold)를 기반으로 제한 효소(restriction enzyme) 비교를 통해 슈퍼-스캐폴드(super-scaffold)를 조립하고, PacBio 긴서열 해독 방법과 Illumina TSLR 합성 긴서열 해독 방법을 이용하여 상기 슈퍼-스캐폴드(super-scaffold) 상의 갭(gap)을 메꾸며, 상기 슈퍼-스캐폴드(super-scaffold)의 오조립 영역을 검증하는 슈퍼-스캐폴드 조립부; 및
상기 슈퍼-스캐폴드(super-scaffold)의 위치와 방향(strand) 정보를 기반으로 염색체(chromosome) 서열을 조립하는 염색체 서열 조립부;
를 포함하는 공통서열을 포함한 참조표준 게놈지도 구축 장치. - 제1항에서,
상기 컨티그 조립부는,
상기 단서열을 기반으로 K-mer 분석을 수행하여 K-mer 빈도 테이블(frequency table)을 획득하고, 상기 K-mer 빈도 테이블(frequency table)을 이용하여 상기 단서열의 에러(error)를 보정하며, 상기 K-mer 빈도 테이블(frequency table)과 상기 드 부루인(De Bruijn) 그래프를 이용하여 에러 보정된 상기 단서열을 기반으로 상기 컨티그(contig)를 조립하는 공통서열을 포함한 참조표준 게놈지도 구축 장치. - 제1항에서,
상기 서열 필터링부는,
상기 단서열과 상기 긴짝서열에서 중복된 리드(read)를 필터링하고, 상기 단서열과 상기 긴짝서열에서 어댑터(adapter) 서열이 포함된 리드(read)를 필터링하며, 상기 단서열과 상기 긴짝서열에서 퀄리티 점수(quality score) 값이 미리 설정된 값보다 작은 서열을 필터링하고, 상기 긴짝서열에서 접합 어댑터(junction adapter)가 포한된 리드(read)를 필터링하며, 상기 단서열과 상기 긴짝서열이 미리 설정된 길이를 가지도록 자르는(trimming) 공통서열을 포함한 참조표준 게놈지도 구축 장치. - 제1항에서,
상기 스캐폴드 조립부는,
상기 컨티그에 상기 긴짝서열을 정렬(alignment)하여 실제 단편 크기(insert size)를 측정하고, 상기 실제 단편 크기(insert size)를 이용하여 상기 컨티그와 상기 긴짝서열을 기반으로 상기 스캐폴드(scaffold)를 조립하며, 상기 스캐폴드(scaffold) 상의 갭(gap)을 메꾸는 공통서열을 포함한 참조표준 게놈지도 구축 장치. - 제1항에서,
상기 슈퍼-스캐폴드 조립부는,
상기 제한 효소(restriction enzyme)를 선택하고, 옵티컬 맵핑(Optical mapping)에 의해 생성된 상기 단일 분자 지도(single molecule map)와 상기 스캐폴드(scaffold)를 기반으로 선택된 상기 제한 효소(restriction enzyme) 패턴의 비교를 통해 상기 슈퍼-스캐폴드(super-scaffold)를 조립하는 공통서열을 포함한 참조표준 게놈지도 구축 장치. - 제1항에서,
상기 슈퍼-스캐폴드 조립부는,
나노채널-기반 게놈 맵핑 데이터(nanochannel-based genome mapping data)를 이용하여 상기 슈퍼-스캐폴드(super-scaffold)의 오조립 영역을 검증하는 공통서열을 포함한 참조표준 게놈지도 구축 장치. - 제1항에서,
상기 염색체 서열 조립부는,
인간게놈지도(GRCh38)에 정렬(align)된 상기 슈퍼-스캐폴드(super-scaffold)의 위치와 방향(strand) 정보를 기반으로 상기 염색체(chromosome) 서열을 조립하는 공통서열을 포함한 참조표준 게놈지도 구축 장치. - 제1항에서,
전장 게놈 서열 데이터(whole genome re-sequencing data)를 이용하여 상기 염색체(chromosome) 서열을 치환하는 서열 치환부를 더 포함하는 공통서열을 포함한 참조표준 게놈지도 구축 장치. - 공통서열을 포함한 참조표준 게놈지도 구축 장치의 게놈지도 구축 방법으로서,
NGS(next generation sequencing)를 이용하여 미리 설정된 값보다 작은 단편 크기(insert size)를 가지는 단서열과 상기 미리 설정된 값보다 큰 단편 크기(insert size)를 가지는 긴짝서열을 생산하는 단계;
상기 단서열과 상기 긴짝서열에서 미리 설정된 리드(read)를 필터링하는 단계;
드 부루인(De Bruijn) 그래프를 이용하여 상기 단서열을 기반으로 컨티그(contig)를 조립하는 단계;
상기 컨티그와 상기 긴짝서열을 기반으로 스캐폴드(scaffold)를 조립하는 단계;
단일 분자 지도(single molecule map)와 상기 스캐폴드(scaffold)를 기반으로 제한 효소(restriction enzyme) 비교를 통해 슈퍼-스캐폴드(super-scaffold)를 조립하는 단계;
PacBio 긴서열 해독 방법과 Illumina TSLR 합성 긴서열 해독 방법을 이용하여 상기 슈퍼-스캐폴드(super-scaffold) 상의 갭(gap)을 메꾸는 단계;
상기 슈퍼-스캐폴드(super-scaffold)의 오조립 영역을 검증하는 단계; 및
상기 슈퍼-스캐폴드(super-scaffold)의 위치와 방향(strand) 정보를 기반으로 염색체(chromosome) 서열을 조립하는 단계;
를 포함하는 공통서열을 포함한 참조표준 게놈지도 구축 방법. - 제9항에서,
상기 컨티그(contig) 조립 단계는,
상기 단서열을 기반으로 K-mer 분석을 수행하여 K-mer 빈도 테이블(frequency table)을 획득하는 단계;
상기 K-mer 빈도 테이블(frequency table)을 이용하여 상기 단서열의 에러(error)를 보정하는 단계; 및
상기 K-mer 빈도 테이블(frequency table)과 상기 드 부루인(De Bruijn) 그래프를 이용하여 에러 보정된 상기 단서열을 기반으로 상기 컨티그(contig)를 조립하는 단계;
를 포함하는 공통서열을 포함한 참조표준 게놈지도 구축 방법. - 제9항에서,
상기 리드(read) 필터링 단계는,
상기 단서열과 상기 긴짝서열에서 중복된 리드(read)를 필터링하는 단계;
상기 단서열과 상기 긴짝서열에서 어댑터(adapter) 서열이 포함된 리드(read)를 필터링하는 단계;
상기 단서열과 상기 긴짝서열에서 퀄리티 점수(quality score) 값이 미리 설정된 값보다 작은 서열을 필터링하는 단계;
상기 긴짝서열에서 접합 어댑터(junction adapter)가 포한된 리드(read)를 필터링하는 단계; 및
상기 단서열과 상기 긴짝서열이 미리 설정된 길이를 가지도록 자르는(trimming) 단계;
를 포함하는 공통서열을 포함한 참조표준 게놈지도 구축 방법. - 제9항에서,
상기 스캐폴드(scaffold) 조립 단계는,
상기 컨티그에 상기 긴짝서열을 정렬(alignment)하여 실제 단편 크기(insert size)를 측정하는 단계;
상기 실제 단편 크기(insert size)를 이용하여 상기 컨티그와 상기 긴짝서열을 기반으로 상기 스캐폴드(scaffold)를 조립하는 단계; 및
상기 스캐폴드(scaffold) 상의 갭(gap)을 메꾸는 단계;
를 포함하는 공통서열을 포함한 참조표준 게놈지도 구축 방법. - 제9항에서,
상기 슈퍼-스캐폴드(super-scaffold) 조립 단계는,
상기 제한 효소(restriction enzyme)를 선택하는 단계; 및
옵티컬 맵핑(Optical mapping)에 의해 생성된 상기 단일 분자 지도(single molecule map)와 상기 스캐폴드(scaffold)를 기반으로 선택된 상기 제한 효소(restriction enzyme) 패턴의 비교를 통해 상기 슈퍼-스캐폴드(super-scaffold)를 조립하는 단계;
를 포함하는 공통서열을 포함한 참조표준 게놈지도 구축 방법. - 제9항에서,
상기 슈퍼-스캐폴드(super-scaffold) 검증 단계는,
나노채널-기반 게놈 맵핑 데이터(nanochannel-based genome mapping data)를 이용하여 상기 슈퍼-스캐폴드(super-scaffold)의 오조립 영역을 검증하는 것으로 이루어진 공통서열을 포함한 참조표준 게놈지도 구축 방법. - 제9항에서,
상기 염색체(chromosome) 서열 조립 단계는,
인간게놈지도(GRCh38)에 정렬(align)된 상기 슈퍼-스캐폴드(super-scaffold)의 위치와 방향(strand) 정보를 기반으로 상기 염색체(chromosome) 서열을 조립하는 것으로 이루어진 공통서열을 포함한 참조표준 게놈지도 구축 방법. - 제9항에서,
전장 게놈 서열 데이터(whole genome re-sequencing data)를 이용하여 상기 염색체(chromosome) 서열을 치환하는 단계를 더 포함하는 공통서열을 포함한 참조표준 게놈지도 구축 방법. - 제9항 내지 제16항 중 어느 한 항에 기재된 공통서열을 포함한 참조표준 게놈지도 구축 방법을 컴퓨터에서 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록 매체에 저장된 컴퓨터 프로그램.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170006310A KR101930253B1 (ko) | 2017-01-13 | 2017-01-13 | 공통서열을 포함한 참조표준 게놈지도 구축 장치 및 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170006310A KR101930253B1 (ko) | 2017-01-13 | 2017-01-13 | 공통서열을 포함한 참조표준 게놈지도 구축 장치 및 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20180083706A true KR20180083706A (ko) | 2018-07-23 |
| KR101930253B1 KR101930253B1 (ko) | 2018-12-18 |
Family
ID=63103154
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020170006310A Expired - Fee Related KR101930253B1 (ko) | 2017-01-13 | 2017-01-13 | 공통서열을 포함한 참조표준 게놈지도 구축 장치 및 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR101930253B1 (ko) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111724858A (zh) * | 2020-05-14 | 2020-09-29 | 东北林业大学 | 利用软件运行基因组序列比对修补gap的方法 |
| CN113178231A (zh) * | 2021-04-26 | 2021-07-27 | 中国科学院武汉病毒研究所 | 一种基于二代测序技术的consensus序列统计分析、可视化方法 |
| CN113416770A (zh) * | 2021-05-28 | 2021-09-21 | 上海韦翰斯生物医药科技有限公司 | 一种染色体结构变异断点的定位方法及装置 |
| CN116343919A (zh) * | 2023-04-11 | 2023-06-27 | 天津大学四川创新研究院 | 一种全基因组图谱绘制测序方法 |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20210129977A (ko) | 2020-04-21 | 2021-10-29 | 주식회사 클리노믹스 | 개체 개별 표준게놈지도의 생성 방법 및 그 시스템 |
| KR102693921B1 (ko) | 2021-06-30 | 2024-08-09 | 건국대학교 산학협력단 | 참조 유전체 및 다양한 시퀀싱 데이터를 이용한 고품질 유전체 어셈블리 제작방법 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20060052710A (ko) | 2003-07-03 | 2006-05-19 | 더 리전트 오브 더 유니버시티 오브 캘리포니아 | 기능성 dna 요소와 세포 단백질의 게놈 지도작성 |
-
2017
- 2017-01-13 KR KR1020170006310A patent/KR101930253B1/ko not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20060052710A (ko) | 2003-07-03 | 2006-05-19 | 더 리전트 오브 더 유니버시티 오브 캘리포니아 | 기능성 dna 요소와 세포 단백질의 게놈 지도작성 |
Non-Patent Citations (5)
| Title |
|---|
| J.Sohn 외 1인, "The present and future of de novo whole-genome assembly." Briefings in bioinformatics. 19권, 1호, pp.23-40. (2016.10.14.) 1부. * |
| R.C.McCoy 외, "Illumina TruSeq synthetic long-reads empower de novo assembly and resolve complex, highly-repetitive transposable elements." PloS one, 9권, 9호, (2014.09.04.) 1부. * |
| Y.DONG 외, "Sequencing and automated whole-genome optical mapping of the genome of a domestic goat (Capra hircus)", Nature biotechnology, 2013, 31권, 2호, pp.135-143, (2012.12.23.) 1부. * |
| 비특허 문헌3 * |
| 비특허논문1 * |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111724858A (zh) * | 2020-05-14 | 2020-09-29 | 东北林业大学 | 利用软件运行基因组序列比对修补gap的方法 |
| CN113178231A (zh) * | 2021-04-26 | 2021-07-27 | 中国科学院武汉病毒研究所 | 一种基于二代测序技术的consensus序列统计分析、可视化方法 |
| CN113178231B (zh) * | 2021-04-26 | 2024-01-05 | 中国科学院武汉病毒研究所 | 一种基于二代测序技术的consensus序列统计分析、可视化方法 |
| CN113416770A (zh) * | 2021-05-28 | 2021-09-21 | 上海韦翰斯生物医药科技有限公司 | 一种染色体结构变异断点的定位方法及装置 |
| CN116343919A (zh) * | 2023-04-11 | 2023-06-27 | 天津大学四川创新研究院 | 一种全基因组图谱绘制测序方法 |
| CN116343919B (zh) * | 2023-04-11 | 2023-12-08 | 天津大学四川创新研究院 | 一种全基因组图谱绘制测序方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR101930253B1 (ko) | 2018-12-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101930253B1 (ko) | 공통서열을 포함한 참조표준 게놈지도 구축 장치 및 방법 | |
| Li et al. | Genome assembly in the telomere-to-telomere era | |
| Viehweger et al. | Direct RNA nanopore sequencing of full-length coronavirus genomes provides novel insights into structural variants and enables modification analysis | |
| Wick et al. | Unicycler: resolving bacterial genome assemblies from short and long sequencing reads | |
| Pilkington et al. | A manually annotated Actinidia chinensis var. chinensis (kiwifruit) genome highlights the challenges associated with draft genomes and gene prediction in plants | |
| Zimin et al. | Hybrid assembly of the large and highly repetitive genome of Aegilops tauschii, a progenitor of bread wheat, with the MaSuRCA mega-reads algorithm | |
| Wang et al. | Assembly of chloroplast genomes with long-and short-read data: a comparison of approaches using Eucalyptus pauciflora as a test case | |
| Bi et al. | Near telomere-to-telomere genome of the model plant Physcomitrium patens | |
| DiGuistini et al. | De novo genome sequence assembly of a filamentous fungus using Sanger, 454 and Illumina sequence data | |
| Sundquist et al. | Whole-genome sequencing and assembly with high-throughput, short-read technologies | |
| US10777301B2 (en) | Hierarchical genome assembly method using single long insert library | |
| Hoffmann et al. | Accurate mapping of tRNA reads | |
| CA2963868A1 (en) | Methods, systems and processes of de novo assembly of sequencing reads | |
| CN113496760A (zh) | 基于第三代测序的多倍体基因组组装方法和装置 | |
| Behera et al. | Plant transcriptome assembly: Review and benchmarking | |
| Steinberg et al. | Building and improving reference genome assemblies | |
| JP2020527938A5 (ko) | ||
| Schmeing et al. | Gapless provides combined scaffolding, gap filling, and assembly correction with long reads | |
| Cacciabue et al. | A beginner’s guide for FMDV quasispecies analysis: sub-consensus variant detection and haplotype reconstruction using next-generation sequencing | |
| Obinu et al. | Benchmarking of Hi-C tools for scaffolding plant genomes obtained from PacBio HiFi and ONT reads | |
| Philippon et al. | IsoSel: protein isoform selector for phylogenetic reconstructions | |
| Cliften | Base calling, read mapping, and coverage analysis | |
| Morioka et al. | Filling in the gap of human chromosome 4: single molecule real time sequencing of macrosatellite repeats in the facioscapulohumeral muscular dystrophy locus | |
| Babokhov et al. | Tandem repeats drive variation of intrinsically disordered regions in budding yeast | |
| Bellec et al. | Long read sequencing technology to solve complex genomic regions assembly in plants |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| N231 | Notification of change of applicant | ||
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20241213 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| H13 | Ip right lapsed |
Free format text: ST27 STATUS EVENT CODE: N-4-6-H10-H13-OTH-PC1903 (AS PROVIDED BY THE NATIONAL OFFICE); TERMINATION CATEGORY : DEFAULT_OF_REGISTRATION_FEE Effective date: 20241213 |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20241213 |