[go: up one dir, main page]

KR20190126606A - IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME - Google Patents

IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME Download PDF

Info

Publication number
KR20190126606A
KR20190126606A KR1020180050721A KR20180050721A KR20190126606A KR 20190126606 A KR20190126606 A KR 20190126606A KR 1020180050721 A KR1020180050721 A KR 1020180050721A KR 20180050721 A KR20180050721 A KR 20180050721A KR 20190126606 A KR20190126606 A KR 20190126606A
Authority
KR
South Korea
Prior art keywords
mirna
expression data
exosome
data
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020180050721A
Other languages
Korean (ko)
Other versions
KR102225231B1 (en
Inventor
류성호
백무준
배윤위
최철원
Original Assignee
순천향대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 순천향대학교 산학협력단 filed Critical 순천향대학교 산학협력단
Priority to KR1020180050721A priority Critical patent/KR102225231B1/en
Publication of KR20190126606A publication Critical patent/KR20190126606A/en
Application granted granted Critical
Publication of KR102225231B1 publication Critical patent/KR102225231B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Oncology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Biology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

The present invention relates to a method for discriminating a cancer patient based on exosome miRNA, which comprises the following steps: receiving, by a computer device, target expression data of a miRNA set isolated from the target exosome; reducing, by the computer device, a dimension of the target expression data; and determining, by the computer device, the degree of similarity between the dimensionally-reduced target expression data and previously prepared reference expression data. The reference expression data is data for a miRNA set isolated from at least one exosome of a patient and a normal person.

Description

엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법 및 장치{IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME}Method and apparatus for identifying cancer patients based on exosome miRNA {IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME}

이하 설명하는 기술은 엑소좀 miRNA 발현데이터를 이용하여 암 환자 여부를 판별하는 기법에 관한 것이다.The technology described below relates to a technique for determining whether a cancer patient using exosome miRNA expression data.

최근 암 조직에 대한 조직검사 대신 반복적으로 얻을 수 있는 혈액 내에서 종양과 관련된 유전자 정보를 얻는 액체 생검(liquid biopsy)이 주목받고 있다. 특히 microRNA(miRNA)와 같이 RNA 상태에서 기능을 수행하는 비암호화 RNA(functional noncoding RNA)에 대한 관심이 높다. 특히 암세포에서 만들어져 혈청내로 분비되는 엑소좀(exosome)에 대한 연구가 활발하다. Recently, liquid biopsy, which obtains genetic information related to tumors in the blood, which can be obtained repeatedly instead of biopsy of cancer tissues, is drawing attention. In particular, there is a great interest in non-coding RNA (functional noncoding RNA) that performs a function in the RNA state, such as microRNA (miRNA). In particular, research on exosomes made in cancer cells and secreted into the serum is active.

국제공개특허 WO2015-190586 (2015.12.17.)International Publication WO2015-190586 (2015.12.17.)

엑소좀의 miRNA는 종양과 같은 질환에 대한 마커로 연구되기도 한다. 다만 종래 연구는 특정 질환에 대한 특정 miRNA를 마커로 발굴하는 연구에 그치고 있다. 이하 설명하는 기술은 엑소좀의 전체 miRNA에 대한 발현데이터를 기준으로 암 발병 여부를 확인하는 기법을 제공하고자 한다.The miRNA of exosomes is also studied as a marker for diseases such as tumors. However, the conventional research is only to find a specific miRNA as a marker for a specific disease. Techniques described below are intended to provide a technique for identifying cancer on the basis of the expression data for the entire miRNA of the exosomes.

엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법은 컴퓨터 장치가 타깃 엑소좀에서 분리한 miRNA 집합의 타깃 발현데이터를 입력받는 단계, 상기 컴퓨터 장치가 상기 타깃 발현데이터의 차원을 축소하는 단계 및 상기 컴퓨터 장치가 상기 차원축소된 타깃 발현데이터와 사전에 마련된 참조 발현데이터의 유사도를 결정하는 단계를 포함한다. 상기 참조 발현데이터는 환자 및 정상인 중 적어도 하나의 엑소좀에서 분리한 miRNA 집합에 대한 데이터이다.A method for determining a cancer patient based on an exosome miRNA includes the steps of a computer device receiving target expression data of a miRNA set separated from a target exosome, the computer device reducing the dimension of the target expression data, and the computer. And determining, by the device, the similarity between the reduced target expression data and previously prepared reference expression data. The reference expression data is data for a miRNA set isolated from at least one exosome of a patient and a normal person.

엑소좀 miRNA를 기준으로 암 환자를 판별하는 장치는 타깃의 엑소좀에서 분리한 miRNA 집합의 타깃 발현데이터를 입력받는 입력 장치, 사전에 마련된 참조 발현데이터를 저장하고, 상기 타깃 발현데이터 및 상기 참조 발현데이터의 유사도를 결정하는 프로그램을 저장하는 저장 장치 및 상기 프로그램을 사용하여 상기 타깃 발현데이터의 차원을 축소하고, 상기 유사도를 연산하는 연산 장치를 포함한다. 상기 참조 발현데이터는 환자 및 정상인 중 적어도 하나의 엑소좀에서 분리한 miRNA 집합에 대한 데이터이고, 상기 miRNA 집합은 엑소좀에서 분리되는 모든 miRNA를 포함한다.An apparatus for determining a cancer patient based on an exosome miRNA stores an input device for receiving target expression data of a miRNA set separated from a exosome of a target, and stores reference expression data prepared in advance, and the target expression data and the reference expression. A storage device for storing a program for determining the similarity of data, and a computing device for reducing the dimension of the target expression data using the program, and calculates the similarity. The reference expression data is data for a miRNA set isolated from at least one exosome of a patient and a normal person, and the miRNA set includes all miRNAs isolated from the exosomes.

이하 설명하는 기술은 엑소좀 miRNA 전체를 분석하여 특정한 miRNA를 분리하지 않고도 간단하게 발병 여부를 판단한다. 이하 설명하는 기술은 참조 데이터와의 유사성을 기준으로 식별이 용이한 판단 기준을 제공한다.The technique described below simply analyzes the entirety of the exosome miRNA to determine whether it is onset without isolating a particular miRNA. The technology described below provides easy criteria for identifying based on similarity with reference data.

도 1은 샘플 엑소좀 miRNA에 대한 필터링 예이다.
도 2는 샘플 엑소좀 miRNA 발현데이터를 처리하는 과정에 대한 예이다.
도 3은 샘플 엑소좀 miRNA 발현데이터에 대한 계층적 군집화한 예이다.
도 4는 샘플 엑소좀 miRNA 발현데이터에 대한 다차원 척도법 수행한 예이다.
도 5는 엑소좀 miRNA 데이터를 기준으로 암 환자를 판별하는 방법에 대한 순서도의 예이다.
도 6은 타깃 miRNA 집합에 대한 다차원 척도법 수행한 예이다.
도 7은 엑소좀 miRNA 데이터를 기준으로 암 환자를 판별하는 컴퓨터 장치에 대한 예이다.
1 is a filtering example for a sample exosome miRNA.
2 is an example of a process of processing sample exosome miRNA expression data.
3 is an example hierarchical clustering of sample exosome miRNA expression data.
4 is an example of performing multidimensional scaling on sample exosome miRNA expression data.
5 is an example of a flowchart for a method of determining cancer patients based on exosome miRNA data.
6 is an example of performing multidimensional scaling on a target miRNA set.
7 is an example of a computer device for discriminating cancer patients based on exosome miRNA data.

이하 설명하는 기술은 다양한 변경을 가할 수 있고 여러 가지 실시례를 가질 수 있는 바, 특정 실시례들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 이하 설명하는 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 이하 설명하는 기술의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.The following description may be made in various ways and have a variety of embodiments, specific embodiments will be illustrated in the drawings and described in detail. However, this is not intended to limit the technology described below to specific embodiments, it should be understood to include all changes, equivalents, and substitutes included in the spirit and scope of the technology described below.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 해당 구성요소들은 상기 용어들에 의해 한정되지는 않으며, 단지 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 이하 설명하는 기술의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.The terms first, second, A, B, etc. may be used to describe various components, but the components are not limited by the terms, but merely for distinguishing one component from other components. Used only as For example, the first component may be referred to as the second component, and similarly, the second component may be referred to as the first component without departing from the scope of the technology described below. The term and / or includes a combination of a plurality of related items or any item of a plurality of related items.

본 명세서에서 사용되는 용어에서 단수의 표현은 문맥상 명백하게 다르게 해석되지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함한다" 등의 용어는 설시된 특징, 개수, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 의미하는 것이지, 하나 또는 그 이상의 다른 특징들이나 개수, 단계 동작 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 배제하지 않는 것으로 이해되어야 한다.As used herein, the singular forms "a," "an," and "the" are intended to include the plural forms as well, unless the context clearly indicates otherwise. It is to be understood that the present invention means that there is a part or a combination thereof, and does not exclude the presence or addition possibility of one or more other features or numbers, step operation components, parts or combinations thereof.

도면에 대한 상세한 설명을 하기에 앞서, 본 명세서에서의 구성부들에 대한 구분은 각 구성부가 담당하는 주기능 별로 구분한 것에 불과함을 명확히 하고자 한다. 즉, 이하에서 설명할 2개 이상의 구성부가 하나의 구성부로 합쳐지거나 또는 하나의 구성부가 보다 세분화된 기능별로 2개 이상으로 분화되어 구비될 수도 있다. 그리고 이하에서 설명할 구성부 각각은 자신이 담당하는 주기능 이외에도 다른 구성부가 담당하는 기능 중 일부 또는 전부의 기능을 추가적으로 수행할 수도 있으며, 구성부 각각이 담당하는 주기능 중 일부 기능이 다른 구성부에 의해 전담되어 수행될 수도 있음은 물론이다.Prior to the detailed description of the drawings, it is to be clear that the division of the components in the present specification is only divided by the main function of each component. That is, two or more components to be described below may be combined into one component, or one component may be provided divided into two or more for each function. Each of the components to be described below may additionally perform some or all of the functions of other components in addition to the main functions of the components, and some of the main functions of each of the components are different. Of course, it may be carried out exclusively by.

또, 방법 또는 동작 방법을 수행함에 있어서, 상기 방법을 이루는 각 과정들은 문맥상 명백하게 특정 순서를 기재하지 않은 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 과정들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.In addition, in carrying out the method or operation method, each process constituting the method may occur differently from the stated order unless the context clearly indicates a specific order. That is, each process may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the reverse order.

엑소좀은 진핵생물체에서 세포간 정보교환을 위해 분비하는 나노 소포체에 해당한다. 엑소좀은 세포가 세포 외부로 방출하는 소낭(세포외소낭)의 일종이다. 엑소좀은 20~100nm 정도의 직경을 갖는 소낭성 입자이다. 엑소좀은 인테그린, MHC 분자, 세포골격 단백질 등을 수송하는 기능을 하기도 한다. 이와 같이 엑소좀은 여러 종류의 단백질을 함유하여 바이오마커로 연구되고 있다.Exosomes correspond to nanovesicles secreted by eukaryotic organisms to exchange information between cells. Exosomes are a type of vesicles (extracellular vesicles) that cells release outside the cell. Exosomes are vesicular particles having a diameter of about 20 to 100nm. Exosomes also serve to transport integrins, MHC molecules, cytoskeleton proteins and the like. As such, exosomes have been studied as biomarkers containing various types of proteins.

miRNA는 동물, 식물, 바이러스에서 발현되는 코딩되지 않는 작은 시퀀스로 약 22개 정도의 뉴클레오타이드로 이루어진 RNA 시퀀스이다. miRNA는 mRNA의 번역을 억제하여 진핵 생물의 유전자 발현을 직접 제어하는 역할을 하기도 한다. miRNA는 식물과 동물 모두에서 잘 보존되며, 다수의 mRAN 기작을 제어하는 것으로 밝혀지고 있다.miRNAs are small, uncoded sequences that are expressed in animals, plants, and viruses. They are RNA sequences consisting of about 22 nucleotides. miRNA also plays a role in directly controlling gene expression in eukaryotes by inhibiting the translation of mRNA. miRNAs are well conserved in both plants and animals and have been found to control many mRAN mechanisms.

엑소좀과 미소낭포는 mRNA와 miRNA를 기원 세포(공여세포)에서 수여세포로 전달할 수 있고, 이로 인해 단백질 발현 혹은 단백질 발현 억제 기능을 통하여 수여세포의 기능에 영향을 미칠 수 있다. mRNA와 miRNA를 함유하고 있는 엑소좀과 미소낭포는 세포들 간의 거리에 관계없이 세포 간의 의사전달을 가능하게 할 수 있다. 이러한 엑소좀과 미소낭포와 연관된 mRNA와 miRNA는 질환 특이적 발병 요인을 나타내기도 한다. 엑소좀이 함유하는 miRNA는 mRNA와 miRNA의 대사질환에서의 바이오마커로 작용할 수 있다. Exosomes and microvesicles can deliver mRNA and miRNA from the originating cell (donor cell) to the recipient cell, thereby affecting the function of the recipient cell through protein expression or protein expression suppression. Exosomes and microvesicles containing mRNA and miRNA can enable intercellular communication, regardless of the distance between them. MRNAs and miRNAs associated with these exosomes and microvesicles also exhibit disease-specific onset factors. The miRNA contained in exosomes can act as a biomarker in metabolic diseases of mRNA and miRNA.

이하 설명하는 기술은 샘플 데이터를 분석하여 암 발병 여부를 예측 내지 진단하는 기법이다. 이하 설명하는 기술은 엑소좀의 miRNA를 분석하여 질환의 발병 여부를 판단한다. 엑소좀 miRNA(exosomal miRNA)의 발현 정도를 분석한다. Techniques described below are techniques for predicting or diagnosing cancer by analyzing sample data. Techniques described below determine the onset of the disease by analyzing the miRNA of the exosomes. The degree of expression of exosomal miRNA is analyzed.

현재는 차세대 염기서열 분석 기술(next generation sequencing, NGS)을 이용하여 주로 RNA의 발현 정도를 확인한다. NGS는 보통 100개 정도의 염기로 구성된 짧은 서열 조각인 리드(read)를 생성하여 염기서열을 해독한다. NGS는 해독한 염기서열을 일반적으로 FASTQ 형식의 파일로 저장한다. 이를 보통 원시(raw) 데이터라고 명명한다.Currently, the next generation sequencing technology (NGS) is used to confirm the expression level of RNA. NGS decodes nucleotide sequences by generating reads, which are usually short sequence fragments of about 100 bases. NGS stores the decoded sequences in a file in FASTQ format. This is usually called raw data.

NGS 리드의 길이는 약 100 bp 정도로 기존 Sanger 타입의 500-1,000 bp에 비하여 길이가 짧고, 시퀀싱 오류가 상대적으로 크며, 플랫폼에 의존하는 오류도 포함될 수 있다. NGS 플랫폼들이 생성하는 FASTQ 파일은 기존의 DNA 염기서열을 나타내는 텍스트 기반의 표준 염기 데이터 형식인 FASTA 형식에 해독한 염기의 정확도(quality score 혹은 error rate)를 포함시킨 것이다.The length of the NGS read is about 100 bp, which is shorter than the 500-1,000 bp of the conventional Sanger type, the sequencing error is relatively large, and may include platform-dependent errors. The FASTQ file generated by the NGS platforms includes the accuracy of a decoded base (quality score or error rate) in the FASTA format, a text-based standard base data format that represents an existing DNA sequence.

먼저 이하 설명하는 기술을 도출하게 된 실험을 설명하고자 한다. 도 1 내지 도 4와 관련된 설명이 실험에 관련된다. 실험은 89개의 샘플을 대상으로 수행하였다. 샘플은 정상 샘플(Control) 33개와 대장암 환자의 샘플(Test) 56개로 구성된다. First, the experiment that led to the following description will be described. 1 to 4 relate to the experiment. The experiment was conducted on 89 samples. The sample consisted of 33 normal samples (Control) and 56 samples of colorectal cancer patients (Test).

시료(혈청 등)에서 엑소좀을 분리하는 과정 및 엑소좀에서 miRNA를 분리(동정)하는 과정을 전제로 한다. 엑소좀 및 miRNA 분리는 다양한 기법을 이용할 수 있고, 상용 키트(kit)를 사용하여 분리할 수도 잇다. 엑소좀에서 전체 2,588개의 mature miRNA를 분리하였다.It is assumed that a process of separating exosomes from a sample (serum, etc.) and a process of separating (identifying) miRNAs from exosomes. Exosomes and miRNA isolation can utilize a variety of techniques, and can also be separated using a commercial kit. A total of 2,588 mature miRNAs were isolated from exosomes.

샘플 엑소좀의 miRNA에 대한 발현데이터를 이용하였다. 샘플 엑소좀의 특정miRNA가 아니고, 전체 miRNA에 대한 발현데이터를 이용하였다. miRNA에 대한 발현데이터는 NGS 분석을 통해 도출할 수 있다. NGS 분석 결과는 컴퓨터가 읽을 수 있는 파일 형태이다. 따라서 miRNA 발현데이터에 대한 처리 과정은 컴퓨터 장치에서 수행된다.Expression data for miRNAs of sample exosomes were used. The expression data for the entire miRNA was used, not the specific miRNA of the sample exosomes. Expression data for miRNA can be derived through NGS analysis. The results of NGS analysis are in the form of computer readable files. Therefore, the processing of miRNA expression data is performed in a computer device.

발현데이터는 다양한 기준으로 표현될 수 있다. RPKM (Reads per kilo base per million mapped reads), RPM(Reads per million mapped reads) 등을 기준으로 분석을 수행할 수 있다. RPM은 주로 miRNA의 발현량을 정규화할 때 사용된다. RPM은 RPKM과 달리 유전자 길이를 고려하지 않는다. miRNA의 크기는 대체적으로 비슷한 20~25 사이에 있기 때문이다.Expression data can be expressed by various criteria. The analysis may be performed based on RPKM (Reads per kilo base per million mapped reads) and RPM (Reads per million mapped reads). RPM is mainly used to normalize miRNA expression. RPM, unlike RPKM, does not consider gene length. This is because the size of miRNAs is generally between 20-25.

먼저 원시 데이터를 전처리할 수 있다. First you can preprocess the raw data.

전처리는 분석에 도움이 되지 않은 데이터를 필터링하는 과정을 포함할 수 있다. 컴퓨터 장치는 mature miRNA에서 일부 miRNA를 제거할 수 있다. 전체 샘플에서 RPM이 0인 miRNA를 찾는다. 컴퓨터 장치는 전체 샘플 중 기준 %이상의 샘플이 0(zero)인 RPM을 갖는 miRNA를 제외할 수 있다. 예컨대, 전체 샘플 중 50% 이상이 0인 RPM을 갖는 miRNA를 분석에서 제외할 수 있다.Preprocessing may include filtering data that did not help with the analysis. The computer device may remove some miRNAs from the mature miRNAs. Find the miRNA with zero RPM in the whole sample. The computer device may exclude miRNAs having an RPM of zero or more of the reference samples of the total samples. For example, miRNAs having an RPM of at least 50% of the total samples may be excluded from the analysis.

도 1은 샘플 엑소좀 miRNA에 대한 필터링 예이다. 도 1은 전체 샘플 중 50% 이상이 0인 RPM을 갖는 miRNA를 필터링하는 예이다. 엑소좀에 포함된 2,588개의 mature miRNA 중에서 2,390개를 필터링하였다. 이후 198개의 mature miRNA를 대상으로 분석을 진행한다. 도 1에서 붉은색으로 표시한 부분이 제거된 miRNA를 나타낸다. 물론 도 1과 달리 RPM이 0인 값을 기준으로 하지 않고, RPM이 특정 기준값 이하인 샘플을 제거할 수도 있다.1 is a filtering example for a sample exosome miRNA. 1 is an example of filtering miRNAs having an RPM of at least 50% of the total samples. 2,390 of 2,588 mature miRNAs contained in exosomes were filtered out. After that, 198 mature miRNAs are analyzed. 1 shows the miRNA from which a portion indicated in red is removed. Of course, unlike FIG. 1, the RPM may not be based on a value of 0, and samples having a RPM below a specific reference value may be removed.

일반적으로 발현값이 낮은 miRNA는 질환에 연관성이 낮다고 할 수 있다. 따라서 필터링 과정을 거치는 것이 조속한 분석에 유리할 수 있다. 다만 필터링 과정은 필수적이지 않다. 경우에 따라서 발현되지 miRNA 패턴도 특정 질환 분석에 유용할 가능성도 있다. In general, miRNAs with low expression values are associated with low disease. Therefore, filtering may be advantageous for rapid analysis. However, the filtering process is not essential. In some cases, miRNA patterns that are not expressed may also be useful for specific disease analysis.

샘플 miRNA의 발현데이터는 복수의 miRNA에 대한 각각의 발현값을 포함한다. 컴퓨터 장치는 발현데이터의 차원을 줄이기 위한 처리를 할 수 있다. 다차원 데이터 분석에서 차원 축소 기법은 다양하다. 따라서 이 과정에서도 다양한 차원 축소 기법 중 어느 하나를 사용할 수 있다. 또 컴퓨터 장치는 발현데이터에 대한 정규화를 수행할 수도 있다.Expression data of a sample miRNA includes respective expression values for a plurality of miRNAs. The computer device may process to reduce the dimension of the expression data. In multidimensional data analysis, dimension reduction techniques are diverse. Therefore, one of the various dimension reduction techniques can be used in this process. The computer device may also perform normalization on the expression data.

도 2는 샘플 엑소좀 miRNA 발현데이터를 처리하는 과정에 대한 예이다. 도 2는 샘플 엑소좀 miRNA 발현데이터에 대한 차원 축소 및 정규화 과정에 대한 예이다.2 is an example of a process of processing sample exosome miRNA expression data. 2 is an example of the dimension reduction and normalization process for the sample exosome miRNA expression data.

도 2(A)는 샘플 엑소좀 miRNA의 발현데이터에 대한 RPM을 도시한 예이다. 도 2(A)는 일부 발현 데이터에 대한 예이다. 도 2(A)는 원시(raw) 데이터에 대한 예이다. 도 2(A)는 도 1에서 필터링된 샘플 엑소좀 miRNA의 발현데이터에 대한 예일 수 있다.Figure 2 (A) is an example showing the RPM for the expression data of the sample exosome miRNA. 2 (A) is an example for some expression data. 2 (A) is an example of raw data. Figure 2 (A) may be an example for the expression data of the sample exosome miRNA filtered in FIG.

컴퓨터 장치는 샘플 엑소좀 miRNA의 발현데이터에 차원을 축소할 수 있다. 예컨대, 아래와 같은 수학식 1을 사용하여 데이터 처리를 할 수 있다. 수학식 1은 RPM에 로그(log2)를 취하여 차원을 축소한다. 차원 축소한 값은 RPMlog라고 표시한다. 원시 데이터 값이 넓은 범위에 걸쳐 분포해 있으면서, 상대적으로 낮은 값에 분포가 치우쳐 있는 경우 로그를 취하면 데이터 값의 범위를 축소하고, 전체적으로 데이터의 분산을 고르게 하여 데이터 확인을 용이하게 할 수 있다.The computer device can reduce the dimension in the expression data of the sample exosome miRNA. For example, data processing may be performed using Equation 1 below. Equation 1 reduces the dimension by taking the log (log 2 ) in the RPM. The dimension reduced value is displayed as RPM log . If the raw data values are distributed over a wide range and the distribution is skewed to a relatively low value, taking a log can reduce the range of data values and make the data evenly distributed throughout, facilitating data validation.

Figure pat00001
Figure pat00001

수학식 1에서 우변에 있는 RPM은 엑소좀 miRNA의 발현데이터의 초기값이다. 수학식 1은 RPM에 1을 더한 값에 로그를 취한 것이다. 이는 RPM이 0인 데이터가 있을 수 있기 때문이다. RPM on the right side of Equation 1 is the initial value of the expression data of exosome miRNA. Equation 1 is the logarithm of the RPM plus one. This is because there may be data with zero RPM.

도 2(B)는 도 2(A)의 miRNA 발현데이터에 로그를 취한 결과를 도시한 예이다. 도 2(B)에서 발현 데이터의 값을 시각적으로 나타내는 그래프는 최소값과 최대값의 범위를 갖는 막대 형태이다. 막대에서 검은색 실선으로 표시된 부분은 해당 샘플의 중앙값(평균값)에 해당한다.Figure 2 (B) is an example showing the results of taking a log in the miRNA expression data of Figure 2 (A). In FIG. 2B, the graph visually representing the value of the expression data is in the form of a bar having a range of minimum and maximum values. The black solid line on the bar corresponds to the median (average) of the sample.

나아가 컴퓨터 장치는 샘플 엑소좀 miRNA의 발현데이터에 대한 정규화를 수행할 수 있다. NGS 분석 결과는 분석 시료나 시스템 환경에 따라 서로 다른 값이 나올 수 있어서, 발현데이터에 대한 일정한 정규화가 바람직하다. 컴퓨터 장치는 다양한 정규화 기법을 사용하여 데이터를 처리할 수 있다. 예컨대, 컴퓨터 장치는 변위치 정규화(quantile normalization)를 수행할 수 있다. 변위치 정규화 중 하나를 설명하면, 컴퓨터 장치는 서로 다른 데이터 세트에서 일정한 기준(오름 차순 또는 내림 차순)으로 데이터를 정렬하고, 정렬된 데이터 세트에서 동일한 순서에 있는 데이터의 값을 동일하게 변경한다. 예컨대, 두 개의 값의 평균으로 데이터의 값을 변경할 수 있다. 이를 통해 컴퓨터 장치는 서로 분포가 다른 데이터 세트를 일정하게 정규화할 수 있다. 경우에 따라서 컴퓨터 장치는 상위 몇 %의 값만을 기준으로 이후 분석을 수행할 수도 있다. 도 2(C)는 도 2(B)의 데이터에 변위치 정규화를 수행한 예이다. 도 2(C)를 살펴보면, 샘플 데이터의 중앙값이 일정하게 유지되는 것을 알 수 있다.Further, the computer device may perform normalization on expression data of a sample exosome miRNA. NGS analysis results may have different values depending on the analyte sample or the system environment, so that regular normalization of expression data is desirable. Computer devices may process data using various normalization techniques. For example, the computer device may perform quantile normalization. Describing one of the displacement value normalizations, the computer device sorts the data in a certain criterion (ascending or descending order) in different data sets and changes the values of the data in the same order in the sorted data sets to be the same. For example, the average of two values can change the value of the data. This allows computer devices to regularly normalize data sets that are different from each other. In some cases, the computer device may perform subsequent analysis based only on the values of the top few percent. FIG. 2 (C) shows an example in which displacement value normalization is performed on the data of FIG. 2B. Referring to FIG. 2C, it can be seen that the median value of the sample data is kept constant.

이제 컴퓨터 장치는 전처리된 데이터에 대한 분석을 수행한다. 컴퓨터 장치는 다수의 객체에 대한 정보를 포함하는 데이터에 대한 분석을 수행한다. The computer device now performs an analysis on the preprocessed data. The computer device performs analysis on the data including information about the plurality of objects.

컴퓨터 장치는 소위 군집분석을 수행할 수 있다. 군집분석은 범주에 대한 사전 정보가 없고, 개체의 유사성을 기준으로 유상성이 높은 개체를 군집으로 분류하는 기법이다. 컴퓨터 장치는 계층적 군집화(hierarchical clustering)를 통해 샘플 엑소좀 miRNA 발현데이터를 분류할 수 있다.The computer device may perform so-called cluster analysis. Cluster analysis is a technique that classifies high-parity individuals into clusters based on their similarity without prior information on categories. The computer device may classify sample exosome miRNA expression data through hierarchical clustering.

계층적 군집화는 개체 간의 유사성을 측정하여, 유사성이 높은 개체를 하나의 그룹으로 분류한다. 계층적 군집화를 위한 다양한 알고리즘이 존재한다. 계층적 군집화에 대하여 간략하게 설명한다. 계층적 군집화는 하나의 군집으로 출발하여 유사성을 기준으로 군집에 속한 개체를 복수의 그룹으로 분할한다. Hierarchical clustering measures similarity between individuals, classifying the highly similar individuals into one group. Various algorithms exist for hierarchical clustering. Hierarchical clustering is briefly described. Hierarchical clustering starts with one cluster and divides the objects belonging to the cluster into a plurality of groups based on similarity.

개체의 유사도는 거리(distance)로 정의한다. 거리는 개체 사이의 비유사성에 대한 척도라고 할 수 있다. 컴퓨터 장치는 다양한 거리를 이용할 수 있다. 예컨대, 유클리드(Euclidean) 거리, 맨하탄(Manhattan) 거리, 피어슨(Pearson) 거리 등을 사용할 수 있다. 유클리드 거리는 두 개의 개체 사이의 최단 거리에 해당한다. 피어슨 거리는 거리를 변수 분산으로 나누어 일정하게 정규화한 값이다. The similarity of an entity is defined by its distance. Distance is a measure of dissimilarity between individuals. Computer devices may use various distances. For example, Euclidean street, Manhattan street, Pearson street, etc. can be used. Euclidean distance is the shortest distance between two entities. Pearson distance is a constant normalized by dividing distance by the variance of the variable.

특정 그룹(집단)과 개체의 유사도는 연결(linkage)로 정의한다. 컴퓨터 장치는 다양한 연결을 사용할 수 있다. 예컨대, 단일 연결, 완전 연결, 중심 연결, 평균 연경 등을 사용할 수 있다. 단일 연결은 두 군집의 개체 중 가장 가까이 있는 개체의 거리를 의미한다. 완전 연결은 두 군집의 개체 중 서로 가장 멀리 있는 개체의 거리를 의미한다. 중심 연결은 군집의 평균값 사이의 거리를 의미한다. 평균 연결은 하나의 군집 개체와 다른 군집 개체들의 각 거리의 평균을 의미한다.The similarity between a group and an entity is defined as linkage. The computer device may use various connections. For example, a single connection, a full connection, a center connection, an average connection can be used. A single connection is the distance of the closest of the two clusters. Fully connected means the distance of the two groups that are farthest from each other. The central link is the distance between the mean values of the clusters. The average linkage means the average of each distance between one clustered entity and another clustered entity.

도 3은 샘플 엑소좀 miRNA 발현데이터에 대한 계층적 군집화한 예이다. 도 3은 유클리드 거리와 완전 연결을 사용하여 계층적 군집화를 수행한 예이다. 도 3은 전술한 RPMlog값을 기준으로 계층적 군집화를 수행한 예이다. 도 3에서 정상 샘플(Control)은 붉은색으로 표시하였고, 환자 샘플(Test)은 파란색으로 표시하였다. 도 3의 결과를 살펴보면, 환자 샘플과 정상 샘플이 서로 다른 그룹으로 분류되는 것을 알 수 있다. 컴퓨터 장치는 샘플 엑소좀 miRNA 발현데이터에 대한 계층적 군집화 결과를 저장한다. 저장한 계층적 군집화 결과를 참조 군집이라고 명명한다. 이후 컴퓨터 장치는 참조 군집을 기준으로 새롭게 입력되는 데이터에 대한 분석을 할 수 있다. 즉, 엑소좀 miRNA 발현데이터를 분석하여, 특정 샘플이 환자인지 또는 정상인지 판단할 수 있다.3 is an example hierarchical clustering of sample exosome miRNA expression data. 3 shows an example of performing hierarchical clustering using Euclidean distance and full connectivity. 3 is an example of performing hierarchical clustering based on the aforementioned RPM log value. In FIG. 3, the normal sample (Control) is shown in red, and the patient sample (Test) is shown in blue. Referring to the results of FIG. 3, it can be seen that patient samples and normal samples are classified into different groups. The computer device stores the hierarchical clustering results for the sample exosome miRNA expression data. The saved hierarchical clustering result is called a reference cluster. The computer device may then analyze the newly input data based on the reference cluster. That is, by analyzing the exosome miRNA expression data, it can be determined whether a particular sample is a patient or normal.

컴퓨터 장치는 샘플 엑소좀 miRNA 발현데이터에 다른 분석을 수행할 수도 있다. 예컨대, 컴퓨터 장치는 다차원 척도법(Multi-Dimensional Scaling, MDS)을 수행할 수 있다. 다차원 척도법은 군집 분석에서와 마찬가지로 자료에 내재된 구조를 찾아내어 자료를 함축적으로 표현하고자 하는 자료 축약 형 다변량 분석 기법이다. 다차원 척도법에서는 개체들 사이의 유사성 또는 비유사성을 평가하는데 사용될 수 있는 기준을 찾아내어 각 기준에 대하여 각 개체를 다차원 공간상에 시각적으로 표현하게 된다. 다차원 척도법도 다양한 기법이 존재한다. 예컨대, 전통적인 다차원 척도법, 계량형 다차원 척도법(metric MDS), 비계량형 다차원 척도법(non-metric MSD) 등이 있다. The computer device may perform another analysis on sample exosome miRNA expression data. For example, the computer device may perform Multi-Dimensional Scaling (MDS). Multidimensional scaling is a data abbreviation multivariate analysis technique that seeks to implicitly represent data by finding structures inherent in cluster analysis. In multidimensional scaling, the criteria that can be used to evaluate similarity or dissimilarity between objects are identified, and each object is visually represented in multidimensional space for each criterion. Multidimensional scaling also has a variety of techniques. For example, traditional multidimensional scaling, metric MDS, non-metric MSD and the like.

다차원 척도법은 개체의 특정 값을 기준으로 유사성 내지 비유사성을 연산하여 다차원(2차원 또는 3차원) 공간에 점으로 표현한다. 컴퓨터 장치는 전술한 RPMlog값을 기준으로 샘플 사이의 유사성 내지 비유사성을 결정할 수 있다. 비유사성은 전술한 거리(예컨대, 유클리드 거리)를 기준으로 정의할 수 있다. 다차원 척도법은 결정한 개체 사이의 거리에 대한 적합도를 연산할 수 있다. 보통 스트레스(stress) 척도를 사용한다. 컴퓨터 장치는 스트레스를 작게 할 수 있는 새로운 좌표를 구하여 개체의 위치를 조정하는 최적화 과정을 반복할 수 있다. 다차원 척도법에 대해서는 널리 알려진 다양한 알고리즘이 있으므로, 자세한 설명은 생략한다.The multidimensional scaling method calculates similarity or dissimilarity based on a specific value of an object and expresses it as a point in a multidimensional (two or three dimensional) space. The computer device may determine the similarity or dissimilarity between the samples based on the RPM log values described above. Dissimilarity can be defined based on the aforementioned distance (eg, Euclidean distance). The multidimensional scaling method can calculate the goodness of fit for the distance between the determined objects. Usually stress measures are used. The computer device may repeat the optimization process of adjusting the position of the object by obtaining new coordinates that may reduce stress. Since there are various well-known algorithms for the multidimensional scaling method, a detailed description thereof will be omitted.

도 4는 샘플 엑소좀 miRNA 발현데이터에 대한 다차원 척도법 수행한 예이다. 도 4는 전술한 RPMlog값을 기준으로 다차원 척도법을 수행한 예이다. 도 4는 샘플 간 유사성 정도를 전체 데이터의 분산성을 제일 잘 설명하는 2개의 요소(component 1 및 component 2)를 이용하여 2차원 공간에 좌표로 표현하였다. 여기서 요소는 분산성을 나타내기 위한 차원에 해당한다. 도 4에서 정상 샘플(Control)은 붉은색으로 표시하였고, 환자 샘플(Test)은 파란색으로 표시하였다. 도 4를 살펴보면, 환자 샘플과 정상 샘플이 서로 다른 패턴을 갖는 것을 알 수 있다. 4 is an example of performing multidimensional scaling on sample exosome miRNA expression data. 4 is an example of performing a multi-dimensional scaling method based on the above RPM log value. In FIG. 4, the degree of similarity between samples is represented by coordinates in two-dimensional space using two components (component 1 and component 2) which best describe the dispersibility of the entire data. The element here is a dimension to represent dispersibility. In FIG. 4, the normal sample (Control) is shown in red, and the patient sample (Test) is shown in blue. Referring to FIG. 4, it can be seen that the patient sample and the normal sample have different patterns.

컴퓨터 장치는 샘플 엑소좀 miRNA 발현데이터에 대한 다차원 척도법 결과를 저장한다. 저장한 다차원 척도법 결과를 참조 패턴이라고 명명한다. 이후 컴퓨터 장치는 참조 패턴을 기준으로 새롭게 입력되는 데이터에 대한 분석을 할 수 있다. 즉, 엑소좀 miRNA 발현데이터를 분석하여, 특정 샘플이 환자인지 또는 정상인지 판단할 수 있다. The computer device stores multidimensional scaling results for sample exosome miRNA expression data. Saved multidimensional scaling results are called reference patterns. Thereafter, the computer device may analyze data newly input based on the reference pattern. That is, by analyzing the exosome miRNA expression data, it can be determined whether a particular sample is a patient or normal.

전술한 설명은 대장암 환자에 대한 데이터를 분석하는 과정과 분석 결과이다. 다만 상기 과정에 따른 분석이 반드시 대장암에 국한되는 것은 아니다. 엑소좀 전체 miRNA의 발현량을 기준으로 특정 질환의 발병 여부를 판단할 수도 있을 것ㅇ이다.The above description is a process and an analysis result of analyzing data for colorectal cancer patients. However, the analysis according to the above process is not necessarily limited to colon cancer. On the basis of the expression level of the exo-some miRNA may determine whether the specific disease.

도 5는 엑소좀 miRNA 데이터를 기준으로 암 환자를 판별하는 방법(100)에 대한 순서도의 예이다. 암 환자를 판별하는 방법(100)은 컴퓨터 장치에서 수행된다. 컴퓨터 장치는 먼저 샘플 엑소좀 miRNA 데이터를 분석하여 참조 데이터를 마련한다(110). 한편 샘플 엑소좀 miRNA 데이터를 샘플 데이터라고 명명한다. 전술한 바와 같이 샘플들 엑소좀의 miRNA 발현 데이터를 분석한다. 컴퓨터 장치는 전술한 과정을 통해 샘플의 유사성 내지 비유사성을 기준으로 계층적 군집화를 수행하여 참조 군집을 마련할 수 있다. 또 컴퓨터 장치는 샘플의 유사성 내지 비유사성을 기준으로 다차원 척도법을 이용하여 참조 패턴을 마련할 수 있다. 참조 데이터는 참조 군집 및 참조 패턴 중 적어도 하나를 포함할 수 있다. 참조 데이터는 특정 샘플이 환자인지 또는 정상인지에 대한 식별자를 포함할 수 있다.5 is an example of a flowchart for a method 100 for determining a cancer patient based on exosome miRNA data. The method 100 for determining a cancer patient is performed in a computer device. The computer device first analyzes sample exosome miRNA data to prepare reference data (110). Meanwhile, the sample exosome miRNA data is called sample data. As described above, miRNA expression data of samples exosomes are analyzed. The computer apparatus may perform hierarchical clustering based on similarity or dissimilarity of the sample to prepare a reference cluster through the above-described process. In addition, the computer device may prepare a reference pattern using a multidimensional scaling method based on the similarity or dissimilarity of the sample. The reference data may include at least one of a reference cluster and a reference pattern. Reference data may include an identifier as to whether a particular sample is patient or normal.

컴퓨터 장치는 이제 분석을 수행할 타깃 시료에 대한 데이터를 획득한다. 타깃 시료에 대한 데이터를 타깃 데이터라고 명명한다. 타깃 데이터는 타깃의 엑소좀 전체의 miRNA에 대한 발현 데이터를 포함한다. 따라서 타깃 데이터는 복수의 miRNA에 대한 데이터를 포함한다. 복수의 miRNA를 타깃 miRNA 집합이라고 명명한다. The computer device now obtains data about the target sample to be analyzed. The data for the target sample is called target data. Target data includes expression data for miRNAs throughout the exosomes of the target. Thus, the target data includes data for a plurality of miRNAs. Multiple miRNAs are called target miRNA sets.

컴퓨터 장치는 타깃 엑소좀 miRNA의 발현데이터(타깃 데이터)를 전처리한다(120). 컴퓨터 장치는 전술한 바와 같이 필터링, 정규화와 같은 전처리를 수행할 수 있다.The computer device preprocesses 120 expression data (target data) of the target exosome miRNA. The computer device may perform preprocessing, such as filtering and normalization, as described above.

컴퓨터 장치는 샘플 데이터와 타깃 데이터의 유사성을 분석한다(130). 유사성은 수학식 1에서 설명한 RPMlog를 기준으로 결정될 수 있다. 컴퓨터 장치는 샘플 데이터와 타깃 데이터의 유클리드 거리를 기준으로 유사성(내지 비유사성)을 판단할 수 있다.The computer device analyzes 130 the similarity between the sample data and the target data. Similarity may be determined based on the RPM log described in Equation 1. The computer device may determine the similarity (or dissimilarity) based on the Euclidean distance of the sample data and the target data.

컴퓨터 장치는 샘플 데이터와 타깃 데이터의 유사성을 기준으로 일정한 분석 결과를 생성한다(140). 컴퓨터 장치는 샘플 데이터와 타깃 데이터에 대한 계층적 군집화를 수행할 수 있다. 또는 컴퓨터 장치는 샘플 데이터와 타깃 데이터에 대한 다차원 척도법을 수행할 수 있다. The computer device generates 140 a result of the analysis based on the similarity between the sample data and the target data. The computer device may perform hierarchical clustering of the sample data and the target data. Alternatively, the computer device may perform multidimensional scaling on the sample data and the target data.

컴퓨터 장치는 분석 결과를 기준으로 타깃에 대한 진단을 할 수 있다(150). 한편 이 과정은 별도의 전문가가 컴퓨터 장치가 140 과정에서 생성한 분석 결과를 이용하여 수행할 수도 있다. 컴퓨터 장치는 도 3과 같은 참조 군집에서 타깃 데이터가 속하는 군집을 기준으로 진단을 수행할 수 있다. 예컨대, 타깃 데이터가 도 3에서 파란색으로 표시한 군집에 속하는 경우, 타깃은 암 환자라고 진단할 수 있다.The computer device may diagnose the target based on the analysis result (150). Meanwhile, this process may be performed by a separate expert using the analysis result generated in step 140 by the computer device. The computer device may perform diagnosis based on the cluster to which the target data belongs in the reference cluster as shown in FIG. 3. For example, when the target data belongs to the cluster shown in blue in FIG. 3, the target may be diagnosed as a cancer patient.

도 6은 타깃 miRNA 집합에 대한 다차원 척도법 수행한 예이다. 도 6은 컴퓨터 장치가 샘플 데이터와 타깃 데이터를 이용하여 다차원 척도법을 수행한 결과에 해당한다. 분석 결과 타깃 miRNA의 위치가 환자 샘플의 위치에 일치하거나, 환자 샘플의 위치에 근접하다면, 컴퓨터 장치는 타깃은 암 환자라고 진단할 수 있다. 반대로 분석 결과 타깃 miRNA의 위치가 정상 샘플의 위치에 일치하거나, 정상 샘플의 위치에 더 근접하다면, 컴퓨터 장치는 타깃은 암 환자라고 진단할 수 있다. 6 is an example of performing multidimensional scaling on a target miRNA set. 6 corresponds to a result of the computer apparatus performing a multidimensional scaling method using sample data and target data. If the analysis indicates that the location of the target miRNA matches or is close to the location of the patient sample, the computer device can diagnose that the target is a cancer patient. Conversely, if the analysis indicates that the location of the target miRNA matches or is closer to the position of the normal sample, the computer device can diagnose that the target is a cancer patient.

이때 컴퓨터 장치는 다양한 기준으로 복수의 환자 샘플의 위치와 타깃의 위치를 비교 분석할 수 있다. 예컨대, 컴퓨터 장치는 환자 샘플의 평균 위치와 타깃의 위치의 거리 또는 정상 샘플의 평균 위치와 타깃의 위치의 거리를 비교하여 진단을 할 수 있다. 컴퓨터 장치는 타깃의 위치가 환자의 평균 위치에 더 가깝다면, 타깃을 환자라고 판단할 수 있다.In this case, the computer device may compare and analyze the positions of the plurality of patient samples and the positions of the targets based on various criteria. For example, the computer device may make a diagnosis by comparing the distance between the average position of the patient sample and the position of the target or the distance between the average position of the normal sample and the position of the target. The computer device may determine the target as the patient if the location of the target is closer to the average position of the patient.

또는 컴퓨터 장치는 복수의 환자 샘플의 위치와 타깃의 위치 사이의 거리를 누적한 값과 복수의 정상 샘플의 위치와 타깃의 위치 사이의 거리를 누적한 값을 비교하여 진단할 수도 있다. 컴퓨터 장치는 환자와의 누적 거리가 더 작은 타깃에 대하여 환자라고 판단할 수 있다.Alternatively, the computer apparatus may diagnose by comparing a value accumulated in the distance between the positions of the plurality of patient samples and the position of the target and a value accumulated in the distance between the positions of the plurality of normal samples and the position of the target. The computer device may determine that the target is for a target having a smaller cumulative distance from the patient.

또한, 상술한 바와 같은 엑소좀 miRNA 데이터를 기준으로 암 환자를 판별하는 방법은 컴퓨터에서 실행될 수 있는 실행가능한 알고리즘을 포함하는 프로그램(또는 어플리케이션)으로 구현될 수 있다. 상기 프로그램은 비일시적 판독 가능 매체(non-transitory computer readable medium)에 저장되어 제공될 수 있다.In addition, the method for determining a cancer patient based on exosome miRNA data as described above may be implemented as a program (or application) comprising an executable algorithm that can be executed in a computer. The program may be stored and provided in a non-transitory computer readable medium.

비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.The non-transitory readable medium refers to a medium that stores data semi-permanently and is readable by a device, not a medium storing data for a short time such as a register, a cache, a memory, and the like. Specifically, the various applications or programs described above may be stored and provided in a non-transitory readable medium such as a CD, a DVD, a hard disk, a Blu-ray disk, a USB, a memory card, a ROM, or the like.

도 7은 엑소좀 miRNA 데이터를 기준으로 암 환자를 판별하는 컴퓨터 장치에 대한 예이다. 도 7은 전술한 컴퓨터 장치에 대한 예이다. 7 is an example of a computer device for discriminating cancer patients based on exosome miRNA data. 7 is an example of the above-described computer device.

도 7(A)는 PC와 같은 컴퓨터 장치(100)가 암 환자를 판별하는 예이다. 컴퓨터 장치(200)는 유전자 DB(50)로부터 분석을 위한 데이터를 수신한다. 유전자 DB(50)는 전술한 샘플 데이터 및 타깃 데이터에 대한 NGS 분석 결과를 보유한다. 유전자 DB(50)는 엑소좀 miRNA에 대한 발현데이터를 보유한다. 컴퓨터 장치(200)는 샘플에 대한 발현데이터를 분석하여, 참조 모델을 수립한다. 참조 모델은 전술한 계층적 군집화에 기반한 참조 군집 및 전술한 다차원 척도법에 기반한 참조 패턴 중 적어도 하나를 포함한다. 컴퓨터 장치(200)는 타깃 데이터에 대한 전처리를 수행하고, 샘플 데이터와의 유사성을 기준으로 계층적 군집화 및/또는 다차원 척도법을 수행한다. 컴퓨터 장치(200)는 유사성 분석 결과를 기준으로 타깃에 대한 진단을 할 수 있다. 자세한 과정은 전술한 바와 같다.7A illustrates an example in which a computer device 100 such as a PC determines a cancer patient. Computer device 200 receives data for analysis from gene DB 50. Gene DB 50 holds the results of NGS analysis on the sample data and target data described above. Gene DB 50 holds expression data for exosome miRNA. Computer device 200 analyzes the expression data for the sample to establish a reference model. The reference model includes at least one of a reference cluster based on hierarchical clustering described above and a reference pattern based on multidimensional scaling described above. The computer device 200 performs preprocessing on the target data, and performs hierarchical clustering and / or multidimensional scaling based on similarity with the sample data. The computer device 200 may diagnose the target based on the result of the similarity analysis. The detailed procedure is as described above.

도 7(B)는 네트워크상의 서버와 같은 컴퓨터 장치(300)가 암 환자를 판별하는 예이다. 컴퓨터 장치(300)는 클라이언트 장치(80)로부터 분석을 위한 데이터를 수신한다. 클라이언트 장치(80)는 개인 PC, NGS 분석 장치 등일 수 있다. 클라이언트 장치(80)는 전술한 샘플 데이터 및 타깃 데이터에 대한 NGS 분석 결과를 보유한다. 클라이언트 장치(80)는 엑소좀 miRNA에 대한 발현데이터를 보유한다. 컴퓨터 장치(300)는 샘플에 대한 발현데이터를 분석하여, 참조 모델을 수립한다. 참조 모델은 전술한 계층적 군집화에 기반한 참조 군집 및 전술한 다차원 척도법에 기반한 참조 패턴 중 적어도 하나를 포함한다. 컴퓨터 장치(300)는 타깃 데이터에 대한 전처리를 수행하고, 샘플 데이터와의 유사성을 기준으로 계층적 군집화 및/또는 다차원 척도법을 수행한다. 컴퓨터 장치(300)는 유사성 분석 결과를 기준으로 타깃에 대한 진단을 할 수 있다. 자세한 과정은 전술한 바와 같다. 컴퓨터 장치(300)는 분석 결과 및 진단 결과를 클라이언트 장치에 전송할 수 있다.7B is an example in which a computer device 300 such as a server on a network determines a cancer patient. Computer device 300 receives data for analysis from client device 80. The client device 80 may be a personal PC, an NGS analysis device, or the like. The client device 80 holds NGS analysis results for the above-described sample data and target data. Client device 80 holds expression data for exosome miRNAs. Computer device 300 analyzes the expression data for the sample to establish a reference model. The reference model includes at least one of a reference cluster based on hierarchical clustering described above and a reference pattern based on multidimensional scaling described above. The computer device 300 performs preprocessing on the target data, and performs hierarchical clustering and / or multidimensional scaling based on similarity with the sample data. The computer device 300 may diagnose the target based on the result of the similarity analysis. The detailed procedure is as described above. The computer device 300 may transmit the analysis result and the diagnosis result to the client device.

도 7(C)는 컴퓨터 장치(400)의 구성을 도시한 블록도의 예이다. 컴퓨터 장치(400)는 전술한 컴퓨터 장치(200) 또는 컴퓨터 장치(300)에 해당한다. 컴퓨터 장치(400)는 입력 장치(410), 연산장치(420), 저장장치(430) 및 출력장치(440)를 포함한다.7C is an example of a block diagram showing the configuration of the computer device 400. The computer device 400 corresponds to the computer device 200 or the computer device 300 described above. The computer device 400 includes an input device 410, a computing device 420, a storage device 430, and an output device 440.

입력장치(410)는 분석을 위한 데이터를 수신한다. 수신하는 데이터는 샘플 데이터 및 타깃 데이터에 대한 NGS 분석 결과를 포함할 수 있다. 수신하는 데이터는 엑소좀 miRNA에 대한 발현데이터를 포함한다. 입력장치(410)는 키보드, 마우스, 터치패드와 같은 물리적인 인터페이스 장치일 수 있다. 또는 입력장치(410)는 외부 저장매체(USB 등)로부터 저장된 유전자 발현데이터를 전달받은 장치일 수도 있다. 또는 입력장치(410)는 외부 네트워크로부터 유전자 발현데이터를 수신하는 통신 모듈일 수도 있다.The input device 410 receives data for analysis. The data received may include NGS analysis results for sample data and target data. The data received includes expression data for exosome miRNAs. The input device 410 may be a physical interface device such as a keyboard, a mouse, or a touch pad. Alternatively, the input device 410 may be a device that receives gene expression data stored from an external storage medium (USB, etc.). Alternatively, the input device 410 may be a communication module for receiving gene expression data from an external network.

저장장치(430)는 전술한 엑소좀 miRNA의 발현데이터를 분석하여 암 발병 여부를 진단하는 프로그램을 저장한다. 저장장치(430)에 저장되는 프로그램은 전술한 설명에 따라 엑소좀 miRNA의 발현데이터를 분석하기 위한 소스 코드를 저장할 수 있다. 저장장치(430)는 샘플 데이터를 분석하여 마련한 참조 모델을 저장할 수 있다.Storage device 430 stores a program for diagnosing the onset of cancer by analyzing the expression data of the aforementioned exosome miRNA. The program stored in the storage device 430 may store source code for analyzing expression data of exosome miRNA according to the above description. The storage device 430 may store a reference model prepared by analyzing sample data.

연산장치(420)는 입력되는 샘플 데이터/ 타깃 데이터와 저장장치(430)에 저장된 프로그램을 이용하여 타깃 데이터에 대한 전처리를 수행하고, 샘플 데이터와의 유사성을 기준으로 계층적 군집화 및/또는 다차원 척도법을 수행한다. 연산장치(420)는 참조 모델과 유사성 분석 결과를 비교하여 타깃에 대한 진단을 할 수 있다. 연산 장치(420)는 CPU, AP(Application processor) 등과 같이 프로그램을 통해 특정한 연산을 처리하는 프로세서 장치를 의미한다.The operation unit 420 performs preprocessing on the target data using the input sample data / target data and the program stored in the storage device 430, and hierarchical clustering and / or multidimensional scaling based on similarity with the sample data. Do this. The operation device 420 may diagnose the target by comparing the result of the similarity analysis with the reference model. The computing device 420 refers to a processor device that processes a specific operation through a program such as a CPU, an application processor (AP), or the like.

출력장치(440)는 샘플 데이터 및 타깃 데이터에 대한 분석 결과를 출력하는 장치이다. 출력장치(440)는 영상을 출력하는 디스플레이 장치, 텍스트를 출력하는 프린터 등일 수 있다. 나아가 출력장치(440)는 분석한 결과를 다른 장치에 전달하는 통신 모듈일 수도 있다.The output device 440 is a device for outputting an analysis result for sample data and target data. The output device 440 may be a display device for outputting an image or a printer for outputting text. Furthermore, the output device 440 may be a communication module for transmitting the result of analysis to another device.

본 실시례 및 본 명세서에 첨부된 도면은 전술한 기술에 포함되는 기술적 사상의 일부를 명확하게 나타내고 있는 것에 불과하며, 전술한 기술의 명세서 및 도면에 포함된 기술적 사상의 범위 내에서 당업자가 용이하게 유추할 수 있는 변형 예와 구체적인 실시례는 모두 전술한 기술의 권리범위에 포함되는 것이 자명하다고 할 것이다.The embodiments and the drawings attached to this specification are merely to clearly show a part of the technical idea included in the above-described technology, and those skilled in the art can easily make it within the scope of the technical idea included in the description and the drawings of the above-described technology. It will be apparent that both the inferred modifications and the specific embodiments are included in the scope of the above-described technology.

50 : 유전자 DB
80 : 클라이언트 장치
200 : 컴퓨터 장치
300 : 컴퓨터 장치
400 : 컴퓨터 장치
410 : 입력장치
420 : 연산장치
430 : 저장장치
440 : 출력장치
50: gene DB
80: client device
200: computer device
300: computer device
400: computer device
410: input device
420: computing device
430: storage device
440: output device

Claims (15)

컴퓨터 장치가 타깃 엑소좀에서 분리한 miRNA 집합의 타깃 발현데이터를 입력받는 단계;
상기 컴퓨터 장치가 상기 타깃 발현데이터의 차원을 축소하는 단계; 및
상기 컴퓨터 장치가 상기 차원축소된 타깃 발현데이터와 사전에 마련된 참조 발현데이터의 유사도를 결정하는 단계를 포함하되,
상기 참조 발현데이터는 환자 및 정상인 중 적어도 하나의 엑소좀에서 분리한 miRNA 집합에 대한 데이터인 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법.
Receiving, by the computer device, target expression data of the miRNA set separated from the target exosome;
The computer device narrowing the dimension of the target expression data; And
Determining, by the computer device, the degree of similarity between the dimensionally reduced target expression data and previously prepared reference expression data,
The reference expression data is a method for determining a cancer patient based on the exosome miRNA that is the data for the set of miRNA isolated from at least one exosome of the patient and normal people.
제1항에 있어서,
상기 miRNA 집합은 엑소좀에서 분리되는 모든 miRNA를 포함하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법.
The method of claim 1,
The miRNA set is a method for discriminating cancer patients based on exosome miRNA including all miRNA isolated from exosomes.
제1항에 있어서,
상기 컴퓨터 장치가 복수의 샘플 중 기준 비율 이상의 샘플에서 RPM(Reads per million mapped reads)이 0(zero)인 miRNA를 제거한 상기 miRNA 집합을 대상으로 상기 유사도를 결정하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법.
The method of claim 1,
The computer device targets a cancer patient based on an exosome miRNA that determines the similarity of the miRNA set from which a miRNA having a reads per million mapped reads (RPM) of 0 (zero) is removed from a plurality of samples. How to determine.
제1항에 있어서,
상기 차원을 축소하는 단계에서 상기 컴퓨터 장치가 상기 타깃 발현데이터의 RPM(Reads per million mapped reads)에 특정값을 더한 값에 대한 로그(log2)를 연산하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법.
The method of claim 1,
In the step of reducing the dimension, the computer device determines a cancer patient based on an exosome miRNA that calculates a log (log 2 ) of a value obtained by adding a specific value to RPMs (Reads per million mapped reads) of the target expression data. How to.
제4항에 있어서,
상기 컴퓨터 장치가 상기 로그 연산한 결과에 대한 변위치 정규화(quantile normalization)를 하는 단계를 더 포함하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법.
The method of claim 4, wherein
And the computer device performing quantile normalization on the logarithmic result.
제1항에 있어서,
상기 컴퓨터 장치는 상기 타깃 발현데이터와 상기 참조 발현데이터에 대한 계층적 군집화(hierarchical clustering)를 수행하여 상기 유사도를 결정하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법.
The method of claim 1,
The computer device may determine a cancer patient based on exosome miRNA that determines the similarity by performing hierarchical clustering on the target expression data and the reference expression data.
제1항에 있어서,
상기 컴퓨터 장치는 상기 타깃 발현데이터와 상기 참조 발현데이터에 대한 다차원 척도법(MultiDimensional Scaling)으로 상기 유사도를 결정하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법.
The method of claim 1,
The computer device may determine a cancer patient based on an exosome miRNA that determines the similarity by MultiDimensional Scaling on the target expression data and the reference expression data.
제7항에 있어서,
상기 컴퓨터 장치는 복수의 환자 엑소좀의 miRNA에 대한 참조 발현데이터에 대한 다차원 척도법 분석결과와 상기 타깃 발현데이터에 대한 다차원 척도법 결과에 대한 패턴을 비교하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법.
The method of claim 7, wherein
The computer apparatus may determine a cancer patient based on exosome miRNA comparing a pattern of multidimensional scaling analysis results of reference expression data of miRNAs of a plurality of patient exosomes with multidimensional scaling results of the target expression data. .
컴퓨터에서 상기 제1항 내지 제8항 중 어느 하나의 항에 기재된 엑소좀 miRNA를 기준으로 암 환자를 판별하는 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.A computer-readable recording medium having recorded thereon a program for executing a method for determining a cancer patient based on the exosome miRNA according to any one of claims 1 to 8 on a computer. 타깃의 엑소좀에서 분리한 miRNA 집합의 타깃 발현데이터를 입력받는 입력 장치;
사전에 마련된 참조 발현데이터를 저장하고, 상기 타깃 발현데이터 및 상기 참조 발현데이터의 유사도를 결정하는 프로그램을 저장하는 저장 장치; 및
상기 프로그램을 사용하여 상기 타깃 발현데이터의 차원을 축소하고, 상기 유사도를 연산하는 연산 장치를 포함하되,
상기 참조 발현데이터는 환자 및 정상인 중 적어도 하나의 엑소좀에서 분리한 miRNA 집합에 대한 데이터이고, 상기 miRNA 집합은 엑소좀에서 분리되는 모든 miRNA를 포함하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 장치.
An input device for receiving target expression data of a miRNA set separated from an exosome of a target;
A storage device for storing reference expression data prepared in advance and storing a program for determining a similarity degree between the target expression data and the reference expression data; And
A computing device that reduces the dimension of the target expression data using the program and calculates the similarity;
The reference expression data is data for a miRNA set isolated from at least one exosome of a patient and a normal person, wherein the miRNA set is a device for discriminating a cancer patient based on an exosome miRNA including all miRNAs separated from the exosome .
제10항에 있어서,
상기 연산장치는 복수의 샘플 중 기준 비율 이상의 샘플에서 RPM(Reads per million mapped reads)이 0(zero)인 miRNA를 제거한 상기 miRNA 집합을 대상으로 상기 유사도를 결정하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 장치.
The method of claim 10,
The arithmetic unit targets a cancer patient based on the exosome miRNA that determines the similarity of the miRNA set from which a miRNA having a reads per million mapped reads (RPM) of 0 (zero) is removed from a plurality of samples. Device to determine.
제10항에 있어서,
상기 연산장치는 상기 타깃 발현데이터의 RPM(Reads per million mapped reads)에 특정값을 더한 값에 대한 로그(log2)를 연산하고, 상기 로그 연산한 결과에 대한 변위치 정규화(quantile normalization)하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 장치.
The method of claim 10,
The computing device calculates a log (log 2 ) of a value obtained by adding a specific value to RPMs (Reads per million mapped reads) of the target expression data, and an exo for quantile normalization of the result of the log operation. Some device to identify cancer patients based on miRNA.
제10항에 있어서,
상기 연산장치는 상기 타깃 발현데이터와 상기 참조 발현데이터에 대한 계층적 군집화(hierarchical clustering)를 수행하여 상기 유사도를 결정하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 장치.
The method of claim 10,
The computing device is a device for determining a cancer patient based on the exosome miRNA to determine the similarity by performing a hierarchical clustering (Herarchical clustering) of the target expression data and the reference expression data.
제10항에 있어서,
상기 연산장치는 상기 타깃 발현데이터와 상기 참조 발현데이터에 대한 다차원 척도법(MultiDimensional Scaling)으로 상기 유사도를 결정하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 장치.
The method of claim 10,
The computing device is a device for discriminating cancer patients based on the exosome miRNA to determine the similarity by the multi-dimensional scaling (MultiDimensional Scaling) for the target expression data and the reference expression data.
제14항에 있어서,
상기 연산장치는 복수의 환자 엑소좀의 miRNA에 대한 참조 발현데이터에 대한 다차원 척도법 분석결과와 상기 타깃 발현데이터에 대한 다차원 척도법 결과에 대한 패턴을 비교하는 엑소좀 miRNA를 기준으로 암 환자를 판별하는 장치.
The method of claim 14,
The computing device is a device for discriminating cancer patients based on exosome miRNA comparing a pattern of multidimensional scaling analysis results of reference expression data of miRNAs of a plurality of patient exosomes with multidimensional scaling results of the target expression data. .
KR1020180050721A 2018-05-02 2018-05-02 IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME Active KR102225231B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180050721A KR102225231B1 (en) 2018-05-02 2018-05-02 IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180050721A KR102225231B1 (en) 2018-05-02 2018-05-02 IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME

Publications (2)

Publication Number Publication Date
KR20190126606A true KR20190126606A (en) 2019-11-12
KR102225231B1 KR102225231B1 (en) 2021-03-09

Family

ID=68577462

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180050721A Active KR102225231B1 (en) 2018-05-02 2018-05-02 IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME

Country Status (1)

Country Link
KR (1) KR102225231B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4350710A4 (en) 2022-08-18 2024-10-09 Exopert Corporation ARTIFICIAL INTELLIGENCE-BASED SYSTEM FOR SIMULTANEOUS DIAGNOSIS OF MULTIPLE CANCERS USING AN EXOSOME-SERS SIGNAL AND METHODS THEREOF

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140090296A (en) * 2012-12-20 2014-07-17 삼성전자주식회사 Method and apparatus for analyzing genetic information
WO2015190586A1 (en) 2014-06-13 2015-12-17 東レ株式会社 Colorectal cancer detection kit or device, and detection method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140090296A (en) * 2012-12-20 2014-07-17 삼성전자주식회사 Method and apparatus for analyzing genetic information
WO2015190586A1 (en) 2014-06-13 2015-12-17 東レ株式会社 Colorectal cancer detection kit or device, and detection method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
K. Zhao 외, "Comparative miRNAome analysis revealed different miRNA expression profiles in bovine sera and exosomes", BMC Genomeics 17:630, 2016.* *
T. Templin 외, "Radiation-induced Micro-RNA Expression Changes in Peripheral Blood Cells of Radiotherapy Patients", Int. J. Radiat Oncol Biol Phys, Author Manuscript, 2011.06.01.* *

Also Published As

Publication number Publication date
KR102225231B1 (en) 2021-03-09

Similar Documents

Publication Publication Date Title
US12242943B2 (en) Generating machine learning models using genetic data
Li et al. Machine learning for lung cancer diagnosis, treatment, and prognosis
US12380964B2 (en) Convolutional neural network systems and methods for data classification
JP7684287B2 (en) Single-cell RNA-SEQ data processing
JP7607264B2 (en) Characteristics of cell-free DNA ends
US20190316209A1 (en) Multi-Assay Prediction Model for Cancer Detection
US20220215900A1 (en) Systems and methods for joint low-coverage whole genome sequencing and whole exome sequencing inference of copy number variation for clinical diagnostics
US20210065847A1 (en) Systems and methods for determining consensus base calls in nucleic acid sequencing
CN107408163B (en) Method and apparatus for analyzing gene
US12421558B2 (en) Systems and methods for joint interactive visualization of gene expression and DNA chromatin accessibility
ES2990062T3 (en) Systems and methods for determining whether a subject has a cancer condition using transfer learning
Larsson et al. Comparative microarray analysis
CN113517022B (en) Gene detection method, feature extraction method, device, equipment and system
CN104508670B (en) System and method for generating biomarker signature
KR20240046481A (en) Systems and methods for associating compounds with physiological conditions using fingerprint analysis
KR20140090296A (en) Method and apparatus for analyzing genetic information
KR102225231B1 (en) IDENTIFYING METHOD FOR TUMOR PATIENT BASED ON miRNA IN EXOSOME AND APPARATUS FOR THE SAME
KR20150039484A (en) Method and apparatus for diagnosing cancer using genetic information
CN116206680B (en) Method, device, equipment and storage medium for detecting tandem repeat area
MA Basher et al. Heterogeneity-preserving discriminative feature selection for disease-specific subtype discovery
Tsai et al. Significance analysis of ROC indices for comparing diagnostic markers: applications to gene microarray data
US20200357484A1 (en) Method for simultaneous multivariate feature selection, feature generation, and sample clustering
CN114496097A (en) A kind of gastric cancer metabolic gene prognosis prediction method and device
Leung et al. Gene selection for brain cancer classification
Arulanandham et al. Role of Data Science in Healthcare

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20180502

PA0201 Request for examination
PG1501 Laying open of application
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20200226

Patent event code: PE09021S01D

AMND Amendment
E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20201028

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D

Patent event date: 20200226

Comment text: Notification of reason for refusal

Patent event code: PE06011S01I

AMND Amendment
PX0901 Re-examination

Patent event code: PX09011S01I

Patent event date: 20201028

Comment text: Decision to Refuse Application

Patent event code: PX09012R01I

Patent event date: 20200423

Comment text: Amendment to Specification, etc.

PX0701 Decision of registration after re-examination

Patent event date: 20201215

Comment text: Decision to Grant Registration

Patent event code: PX07013S01D

Patent event date: 20201126

Comment text: Amendment to Specification, etc.

Patent event code: PX07012R01I

Patent event date: 20201028

Comment text: Decision to Refuse Application

Patent event code: PX07011S01I

Patent event date: 20200423

Comment text: Amendment to Specification, etc.

Patent event code: PX07012R01I

X701 Decision to grant (after re-examination)
GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20210303

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20210303

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20241224

Start annual number: 5

End annual number: 5