[go: up one dir, main page]

WO2021091288A1 - 기계 학습 모델을 이용한 간세포암 예측 방법 및 시스템 - Google Patents

기계 학습 모델을 이용한 간세포암 예측 방법 및 시스템 Download PDF

Info

Publication number
WO2021091288A1
WO2021091288A1 PCT/KR2020/015475 KR2020015475W WO2021091288A1 WO 2021091288 A1 WO2021091288 A1 WO 2021091288A1 KR 2020015475 W KR2020015475 W KR 2020015475W WO 2021091288 A1 WO2021091288 A1 WO 2021091288A1
Authority
WO
WIPO (PCT)
Prior art keywords
layer
hepatocellular carcinoma
patient
data
residual block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/KR2020/015475
Other languages
English (en)
French (fr)
Inventor
정숙향
남준열
신동현
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Life Public Welfare Foundation
Seoul National University Hospital
Original Assignee
Samsung Life Public Welfare Foundation
Seoul National University Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020200139340A external-priority patent/KR20210054987A/ko
Application filed by Samsung Life Public Welfare Foundation, Seoul National University Hospital filed Critical Samsung Life Public Welfare Foundation
Publication of WO2021091288A1 publication Critical patent/WO2021091288A1/ko
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Definitions

  • the embodiments of the present invention relate to a technology for predicting whether a target patient is a patient with hepatocellular carcinoma, and in more detail, a target patient, particularly a patient with hepatitis B virus (HBV)-related liver cirrhosis, using a pre-learned machine learning model. It relates to a method for assisting in predicting or diagnosing whether a patient has a patient and a system for performing the same.
  • HBV hepatitis B virus
  • Hepatocellular carcinoma (or hepatocellular carcinoma) is cancer that occurs in the presence of several risk factors such as cirrhosis or chronic hepatitis, and rarely occurs in people without such risk factors. Patients with risk factors are subject to hepatocellular carcinoma surveillance for early detection of hepatocellular carcinoma throughout their lifetime. The HCC surveillance is currently limited to twice a year worldwide, but it is not an optimized program for each individual because the probability of HCC varies depending on the severity of the disease.
  • Predicting the risk of hepatocellular carcinoma can provide a great basis for planning hepatocellular carcinoma surveillance, and tailor-made treatment policies for each patient according to each patient's situation. For this reason, a method or protocol for predicting hepatocellular carcinoma using various factors has been developed and published.
  • HBV hepatitis B virus
  • the method for predicting hepatocellular carcinoma comprising: acquiring attribute data of a target patient; And predicting whether a target patient is a hepatocellular carcinoma patient by applying the plurality of attribute data to a pre-learned prediction model, wherein the target patient is a patient with hepatic cirrhosis related to HBV (Hepatitis B virus), providing a method for predicting hepatocellular carcinoma do.
  • HBV Hepatitis B virus
  • the attribute data includes binary data and numerical data
  • the numerical data may be input to an initial fully connected layer in an initial residual block as a continuous value
  • the prediction model may include a plurality of residual blocks, each residual block may each include a plurality of layer arrangements, and the plurality of layer arrangements may each include a fully connected layer.
  • each residual block may each include a plurality of layer arrangements
  • the plurality of layer arrangements may each include a fully connected layer.
  • the following layer arrangement and the preceding most preceding layer arrangement are residually connected so that the output of the following layer arrangement is summed with the input of the preceding layer arrangement.
  • the initial fully connected layer may include a plurality of nodes, and the plurality of attributes may be pre-allocated to the plurality of nodes, so that each attribute data may be input to a corresponding node.
  • the layer arrangement may further include at least one of a placement normalization layer, an activation layer, and a drop-out layer as a subsequent layer of the fully connected layer.
  • the prediction model may include a first residual block and a second residual block. At least one of the first residual block and the second residual block includes at least a first to third layer arrangement, and each of the first to third layer arrangements is a fully connected layer, a batch normalization layer, an active layer, and a drop-out. It can also include layers.
  • the plurality of attributes may include at least a part of age, sex, platelet count, serum albumin concentration, serum bilirubin concentration, non-hepatitis virus (HBV) concentration, diabetes, and follow-up period.
  • the sex and diabetic properties are expressed as binary data, and the rest of the properties are expressed as numeric data.
  • the final residual block of the predictive model outputs a two-dimensional data array
  • the predictive model calculates a probability that the target patient has hepatocellular carcinoma based on the two-dimensional data array, and the calculated probability is If it is greater than a predetermined threshold probability, it may be determined that the target patient has hepatocellular carcinoma.
  • the computer-readable recording medium may record a computer program for performing the method for predicting hepatocellular carcinoma according to the above-described embodiments.
  • an acquisition unit for acquiring attribute data of a target patient; And a prediction unit for predicting whether a target patient is a hepatocellular carcinoma patient by applying the plurality of attribute data to a pre-learned prediction model, wherein the target patient is a patient with hepatocellular carcinoma related to HBV (Hepatitis B virus).
  • HBV Hepatitis B virus
  • the system according to an embodiment of the present invention applies a continuous value for a specific attribute of the target patient to a prediction model formed using all the related attributes related to HCC prediction, and thus the target patient, especially the HBV (Hepatitis B virus)-related cirrhosis patient. Can more accurately predict whether or not is a hepatocellular carcinoma patient.
  • HBV Hepatitis B virus
  • FIG. 1 is a flowchart of a method for predicting hepatocellular carcinoma according to an embodiment of the present invention.
  • FIG. 2 is a network structure diagram of a prediction model according to an embodiment of the present invention.
  • FIG. 3 is a diagram for evaluating the performance of a prediction model according to a risk group in a verification data set according to an experimental example of the present invention.
  • FIG. 4 is a diagram showing prediction results of three test subjects according to an experiment of the present invention.
  • FIG. 1 is a flowchart of a method for predicting hepatocellular carcinoma according to an embodiment of the present invention.
  • the method for predicting hepatocellular carcinoma includes obtaining attribute data of a target patient (S100).
  • the subject patient may in particular be a patient with cirrhosis related to Hepatitis B virus (HBV).
  • HBV Hepatitis B virus
  • the attribute data is data expressing various attributes related to a patient's physical condition, and the attribute includes a formal attribute of the patient and a practical attribute that is more directly used for predicting hepatocellular carcinoma.
  • the formal attribute includes, for example, one or more of age, sex, height, and weight.
  • the substantial attribute may include, for example, the presence of cirrhosis, the presence of diabetes, platelet count, serum bilirubin, serum albumin, HBV DNA titer, and one or more of the observation periods from the index-visit. .
  • the index of the number of days of visit is defined from the first day of entecavir prescription.
  • the presence or absence of cirrhosis is defined by the number of platelets, images of the edges of the liver, the presence of portal hypertension, and/or non-compensatory features such as ascites or hepatic encephalopathy.
  • the number of platelets may be less than 100,000/mL, for example.
  • the image of the liver edge is obtained through cirrhosis ultrasound or tomography, and may include a blunted liver edge having an enlarged spleen of more than 12 cm.
  • Portal hypertension may include, for example, esophageal or gastric varicose veins.
  • the presence or absence of diabetes depends on the medical history of glucose levels and/or the history of prescriptions of anti-diabetic drugs.
  • the attribute data is composed of binary data and numeric data. Numerical data has continuous values.
  • the attribute expressed as binary data may include gender and/or the presence or absence of diabetes.
  • the rest of the attributes are expressed as numeric data. For example, attribute data of platelet count, serum albumin concentration, serum bilirubin concentration, and non-hepatitis virus (HBV) concentration are expressed as continuous values.
  • the hepatocellular carcinoma prediction method includes: predicting whether the target patient is a hepatocellular carcinoma patient by applying attribute data of the target patient to a prediction model (S300).
  • the prediction model is a machine learning model having a deep neural network structure.
  • the prediction model may have a neural network structure such as, for example, Recurrent Neural Nerwork (RNN), Convolutional Neural Network (CNN), and Residual Network (ResNet), but is not limited thereto.
  • RNN Recurrent Neural Nerwork
  • CNN Convolutional Neural Network
  • ResNet Residual Network
  • FIG. 2 is a network structure diagram of a prediction model according to an embodiment of the present invention.
  • the prediction model includes a plurality of residual blocks. At least one residual block may receive an output value of another residual block as an input value.
  • the prediction model may include two residual blocks.
  • the second residual block of FIG. 2 receives an output value of the first residual block as an input value.
  • the residual block has a structure in which a kind of skip connection (or referred to as a shortcut connection) is added to an existing stacked structure in a CNN-based model having a deep structure. .
  • the data to be finally learned is H(x).
  • Each of the plurality of residual blocks in the prediction model includes a plurality of layer arrangements.
  • the layer arrangement includes fully connected layers.
  • the fully connected layer is a layer consisting of a plurality of nodes corresponding to neurons in a human neural network.
  • a plurality of nodes between adjacent layers are fully connected, and connection weights may be individually set.
  • the layer arrangement may further include at least one of an arrangement normalization layer, an activation layer, and a drop-out layer as a subsequent layer of the fully connected layer.
  • the residual block may have a layer arrangement consisting of a complete connection layer, a batch normalization layer activation layer, and a drop-out layer in the order.
  • the activation layer is configured to apply an activation function to replace the input value.
  • the activation layer takes an operation result (eg, a weighted sum) for all inputs of the previous layer, generates an output value, and passes it to the next layer.
  • the activation layer is an activation function, and an input value may be replaced using a ReLU or Sigmoid function.
  • the residual block performs a normalization operation to reduce over-fitting in a learning step through a batch normalization layer and/or a drop-out layer.
  • the batch normalization layer allows the network operation result to be calculated according to the distribution in the desired direction (i.e., for learning purposes).
  • the batch normalization layer is configured to normalize the distribution of input values to a distribution with a mean of 0 and a standard deviation of 1.
  • the batch normalization layer adds a scale factor and a shift factor to the normalized value.
  • the size factor and the variance factor are parameters determined by training of the predictive model. The nonlinearity of the activation function can be eliminated due to the size factor and the variance factor.
  • the batch normalization layer can prevent weight loss or weight explosion (especially without largely considering initial weight values). Due to the batch normalization layer, the problem of internal covariate shift is eliminated, and a model having a deep layer structure can be quickly learned.
  • the drop-out layer operates to omit a part of the network of the model. Some omissions of the network may be implemented at random.
  • the drop-out layer has a form in which the ratio at which each neuron will survive is multiplied by each weight.
  • the ratio less than the above is, for example, a probability value of 50% or less, and may be, for example, 20%, 30%, etc., but is not limited thereto.
  • the layer arrangement including the inner layer may be at least partially the same as other layer arrangements.
  • the residual block includes an arrangement of three layers, and each layer arrangement may include a fully connected layer, a placement normalization layer, an activation layer, and a dropout layer.
  • the following layer arrangement and the preceding most preceding layer arrangement are residual-connected so that the output of the following layer arrangement is summed up with the input of the preceding layer arrangement.
  • the residual block to which the input data of the model is first input is referred to as an initial fully connected layer.
  • a fully connected layer to which input data of a block is first input is referred to as an initial fully connected layer.
  • some and other parts may be configured to have different channels.
  • the first layer arrangement and the third layer arrangement may have 16 channels, but the second layer arrangement may have 64 channels.
  • the initial fully connected layer in the initial residual block in which the attribute data of the patient is first input includes a plurality of input nodes.
  • Each of the input variables, that is, attribute data, is input to its own input node allocated for each attribute.
  • the layer may include 8 input nodes each corresponding to the 8 attributes.
  • attribute data of a target patient input to the predictive model may be pre-arranged to be input to a corresponding input node.
  • a corresponding input node (eg, an input node for gender, diabetes, etc.) allocated to the binary data receives the binary data as it is.
  • the corresponding input node e.g., platelet count, serum albumin, serum bilirubin, HBV DNA titer, observation period from the number of days visited index
  • the corresponding input node assigned to the numerical data is not classified as a specific cut-off value, but is input as a continuous value.
  • each attribute data that is, an input variable
  • its own input node so that even if the attribute data of the target patient consisting of variable data and numeric data is input to the predictive model, one type of data is not It is not affected by the data.
  • the last residual block outputs a 2D data array.
  • the predictive model calculates a determination value for classifying whether the target patient is a patient with hepatocellular carcinoma based on the 2D data arrangement.
  • the predictive model determines whether a patient with input patient information corresponds to a liver cancer patient based on the determination value.
  • the prediction model may calculate a probability value between 0 and 1 as a determination value by applying a softmax function to the 2D data array.
  • the predictive model is classified as a hepatocellular carcinoma patient when the probability value is greater than or equal to a predetermined threshold function.
  • the predictive model is trained using a plurality of training data sets.
  • the attribute data of the target patient corresponding to the attribute of the used training data set is input into the predictive model.
  • each of the training data for each trained patient is when attribute data including the observation period from the indicators of sex, age, platelet count, serum albumin, serum bilirubin, HBV DNA titer, diabetes presence, and length of visitation are input, the initial residual block
  • the initial fully connected layer of may contain data for eight attributes.
  • the predictive model is trained using a relatively small number of numeric data points rather than an image data set, and thus has a specification that can be easily implemented in a general laptop computer without multiple GPUs.
  • the parameters of the prediction model are updated in a direction in which the loss function of the prediction model is minimized.
  • parameters of a prediction model such as a connection weight and a threshold function, are updated in a direction in which the loss function of the corresponding model is minimized.
  • the loss function depends on the difference between the result value produced by the model and the actual result value.
  • the loss function may be a weight cross entropy function. Then, the class imbalance is learned to be controlled.
  • parameter optimization may be performed through ADAM (Adaptive Moment Estimation), but is not limited thereto, and various gradient discents such as Momentum, NAG (Nesterov Accelerated Gradient), Adagrad (Adaptive Gradient), RMSProp, etc. It can also be done by way.
  • ADAM Adaptive Moment Estimation
  • NAG Nesterov Accelerated Gradient
  • Adagrad Adaptive Gradient
  • RMSProp Adaptive Gradient
  • the residual block in the prediction model is learned through the above-described residual learning. Residual learning is performed on all stack layers in the prediction model, and residual learning is completed through linking of stack layers. By integrating the next input and output variables of each layer, it provides additional nonlinearity and reduces additionally generated weights to improve learning performance. For residual blocks having a shortcut structure, the learning performance is improved by minimizing the value of the loss function by the centering layer responses and propagated errors implemented by the shortcut connection.
  • Whether or not a patient has hepatocellular carcinoma in the past was determined by the age, sex, platelet count, serum albumin, serum bilirubin, HBV DNA titer, liver cirrhosis, diabetes, and race. Were predicted using 3 to 6 partial attributes showing a significant association with the onset of. However, the embodiments of the present invention may be more accurately predicted using all the attributes associated with the onset of hepatocellular carcinoma.
  • the acquisition unit for acquiring attribute data of a target patient; And a prediction unit for predicting whether a target patient is a hepatocellular carcinoma patient by applying the plurality of attribute data to a pre-learned prediction model, wherein the target patient is a patient with hepatocellular carcinoma related to HBV (Hepatitis B virus). can do.
  • a description of the steps performed by each acquisition unit and prediction unit is the same as described above, and thus will be omitted.
  • the system for performing the HCC prediction method may have an aspect that is entirely hardware, entirely software, or partially hardware and partially software.
  • the system may collectively refer to hardware equipped with data processing capability and operating software for driving the same.
  • terms such as “unit”, “module”, “device”, or “system” are intended to refer to a combination of hardware and software driven by the hardware.
  • the hardware may be a data processing device including a central processing unit (CPU), a graphical processing unit (GPU), or another processor.
  • software may refer to an executing process, an object, an executable file, a thread of execution, a program, and the like.
  • system may include other components not described herein.
  • system may include other hardware elements required for the operations described herein, including a network interface, an input device for data entry, and an output device for display, printing, or other data display.
  • 3 and 4 are diagrams for explaining the performance of the model of FIG. 2 according to an experimental example of the present invention.
  • the deep neural network was constructed based on the 1.13 version of TensorFlow.
  • the model was optimized using the Adam optimization algorithm.
  • ReLU parametri rectified linear unit
  • Batch normalization was applied with dropout.
  • the performance of this predictive model was evaluated using a validation data set having the features of Table 1 below. This validation data set included 68 hepatocellular carcinoma patients during a median 6.4 year follow-up period.
  • FIG. 3 is a diagram for evaluating the performance of a prediction model according to a risk group in a verification data set according to an experimental example of the present invention.
  • the critical probability of the prediction model is designated as 0.5.
  • Validation patients were classified into two groups by applying attribute data of validation patients to the predictive model.
  • the high-risk group ( ⁇ 0.5) had a significantly higher incidence of HCC than the low-risk group ( ⁇ 0.5).
  • FIG. 4 is a diagram showing prediction results of three test subjects according to an experiment of the present invention.
  • the method for predicting hepatocellular carcinoma according to the above-described embodiments and an operation by a system for performing the same may be implemented at least partially as a computer program and recorded in a computer-readable recording medium.
  • a program product composed of a computer-readable medium containing program code, which can be executed by a processor for performing any or all steps, operations, or processes described.
  • the computer may be a computing device such as a desktop computer, laptop computer, notebook, smart phone, or the like, or may be any device that may be integrated.
  • a computer is a device with one or more alternative special purpose processors, memory, storage, and networking components (either wireless or wired).
  • the computer may run, for example, an operating system compatible with Microsoft's Windows, Apple OS X or iOS, a Linux distribution, or an operating system such as Google's Android OS.
  • the computer-readable recording medium includes all types of record identification devices storing data that can be read by a computer.
  • Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage identification device, and the like.
  • the computer-readable recording medium may be distributed over a computer system connected through a network, and computer-readable codes may be stored and executed in a distributed manner.
  • functional programs, codes, and code segments for implementing this embodiment may be easily understood by those of ordinary skill in the art to which this embodiment belongs.
  • Embodiments of the present invention relate to a method for predicting whether a target patient, in particular, a patient with hepatic cirrhosis related to HBV (Hepatitis B virus), is a patient with hepatocellular carcinoma using a machine learning model learned in advance, and a system for performing the same.
  • a target patient in particular, a patient with hepatic cirrhosis related to HBV (Hepatitis B virus)
  • HBV Hepatitis B virus

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

실시예들은 대상 환자의 속성 데이터를 획득하는 단계 - 상기 속성 데이터는 간세포암과 관련된 복수의 속성에 대한 데이터를 포함함; 및 미리 학습된 예측 모델에 상기 복수의 속성 데이터를 적용하여 대상 환자가 간세포암 환자인지 예측하는 단계를 포함하는 간세포암 예측 방법 및 시스템에 관련된다.

Description

기계 학습 모델을 이용한 간세포암 예측 방법 및 시스템
본 발명의 실시예들은 대상 환자가 간세포암을 갖는 환자인지 예측하는 기술에 관한 것으로서, 보다 상세하게는 미리 학습된 기계 학습 모델을 이용하여 대상 환자 특히 HBV(Hepatitis B virus) 관련 간경변 환자가 간세포암을 갖는 환자인지 예측 또는 진단을 보조하는 방법 및 이를 수행하는 시스템에 관련된다.
간세포 암(또는 간세포암)은 간경변증이나, 만성 간염 등의 몇가지 위험인자가 있는 상태에서 발생하는 암이며, 그 위험인자가 없는 사람에서는 거의 발생하지 않는다. 위험인자를 가진 환자는 평생동안 간세포암의 조기발견을 위해서 간세포암 감시(Hepatocellular carcinoma surveillance)를 받게 된다. 이 간세포암 감시에 대해서는 현재 전세계적으로 연 2회로 한정하여 시행하고 있지만, 질병의 심각도에 따라 간세포암의 발생 확률은 달라지기 때문에 개인별로 최적화된 프로그램은 아니다.
간세포암의 위험도를 예측하는 것은 간세포암 감시의 계획을 세우는데 큰 근거를 마련할 수 있고, 환자 개개인의 상황에 따라 환자 맞춤별 진료 방침을 세울 수 있게 된다. 이러한 이유로 현재 다양한 인자를 이용한 간세포암 예측 방법 또는 프로토콜이 개발되어 논문화 되었다.
그러나, 현재 임상적으로 널리 쓰이는 방법은 특별히 없다. 따라서, 높은 정확도를 가지면서 간세포암을 예측하는 모델의 개발이 요구된다.
본 발명의 일 측면에 따르면 기계 학습을 통해 높은 정확도를 갖는 간암 예측 모델을 이용하여 대상 환자 특히 HBV(Hepatitis B virus) 관련 간경변 환자가 간세포암 환자인지 예측하는 동작을 수행하는 시스템을 제공할 수도 있다.
이 외에도, 간세포암 예측 방법 및 이를 수행하게 하는 명령어들을 기록한 컴퓨터 판독가능한 기록매체를 제공할 수 있다.
본 발명의 일 실시예에서는, 프로세서에 의해 수행되는 간세포암 예측 방법에 있어서, 대상 환자의 속성 데이터를 획득하는 단계; 및 미리 학습된 예측 모델에 상기 복수의 속성 데이터를 적용하여 대상 환자가 간세포암 환자인지 예측하는 단계를 포함하되, 상기 대상 환자는 HBV(Hepatitis B virus) 관련 간경변 환자인, 간세포암 예측 방법을 제공한다.
일 실시예에서, 상기 속성 데이터는 이진형 데이터 및 수치형 데이터를 포함하며, 상기 수치형 데이터는 연속 값으로 초기 잔차 블록 내 초기 완전 연결층에 입력될 수도 있다.
일 실시예에서, 상기 예측 모델은 복수의 잔차 블록을 포함하고 각 잔차 블록은 복수의 레이어 배열을 각각 포함하고, 상기 복수의 레이어 배열은 완전 연결층을 각각 포함할 수도 있다. 동일한 잔차 블록 내에서 가장 후행 레이어 배열의 출력이 가장 선행 레이어 배열의 입력과 합산되도록 가장 후행 레이어 배열과 상기 가장 선행 레이어 배열이 잔차 연결된다.
일 실시예에서, 상기 초기 완전 연결층은 복수의 노드를 포함하고, 상기 복수의 노드에 상기 복수의 속성이 각각 미리 할당되어 각각의 속성 데이터는 해당 노드에 각각 입력될 수도 있다.
일 실시예에서, 상기 레이어 배열은 상기 완전 연결층의 후행 레이어로서 배치 정규화 레이어, 활성화 레이어 및 드롭-아웃 레이어 중 적어도 하나를 더 포함할 수도 있다.
일 실시예에서, 상기 예측 모델은 제1 잔차 블록 및 제2 잔차 블록을 포함할 수도 있다. 상기 제1 잔차 블록 및 제2 잔차 블록 중 적어도 하나는 적어도 제1 내지 제3 레이어 배열을 포함하며, 상기 제1 내지 제3 레이어 배열 각각은 완전 연결 레이어, 배치 정규화 레이어, 활성화 레이어 및 드롭-아웃 레이어를 포함할 수도 있다.
일 실시예에서, 상기 복수의 속성은 나이, 성별, 혈소판 수, 혈청 알부민 농도, 혈청 빌리루빈 농도, 비형 간염 바이러스(HBV) 농도, 당뇨병 유무 및 추적관찰기간 중 적어도 일부를 포함할 수도 있다. 상기 성별 및 당뇨병 유무의 속성은 이진형 데이터로 표현되고, 나머지 속성은 수치형 데이터로 표현된다.
일 실시예에서, 상기 예측 모델의 최종 잔차 블록은 2차원 데이터 배열을 출력하고, 상기 예측 모델은 상기 2차원 데이터 배열에 기초하여 상기 대상 환자가 간세포암을 가질 확률을 산출하며, 산출된 확률이 소정 임계 확률 보다 큰 경우, 대상 환자가 간세포암을 갖고 있는 것으로 판단할 수도 있다.
본 발명의 다른 일 측면에 따른 컴퓨터 판독가능 기록매체는 상술한 실시예들에 따른 간세포암 예측 방법을 수행하기 위한 컴퓨터 프로그램을 기록할 수도 있다.
본 발명의 일 실시예에서는, 또한, 대상 환자의 속성 데이터를 획득하는 획득부; 및 미리 학습된 예측 모델에 상기 복수의 속성 데이터를 적용하여 대상 환자가 간세포암 환자인지 예측하는 예측부를 포함하고, 상기 대상 환자는 HBV(Hepatitis B virus) 관련 간경변 환자인, 간세포암 예측 시스템을 제공한다.
본 발명의 일 실시예에 따른 시스템은 간세포암 예측과 관련된 모든 관련 속성을 사용하여 형성된 예측 모델에 대상 환자의 특정 속성에 대한 연속 값을 그대로 적용하여 대상 환자 특히 HBV(Hepatitis B virus) 관련 간경변 환자가 간세포암 환자인지를 보다 정확하게 예측할 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명 또는 종래 기술의 실시예의 기술적 해결책을 보다 명확하게 설명하기 위해, 실시예에 대한 설명에서 필요한 도면이 아래에서 간단히 소개된다. 아래의 도면들은 본 명세서의 실시예를 설명하기 목적일 뿐 한정의 목적이 아니라는 것으로 이해되어야 한다. 또한, 설명의 명료성을 위해 아래의 도면들에서 과장, 생략 등 다양한 변형이 적용된 일부 요소들이 도시될 수 있다.
도 1은, 본 발명의 일 실시예에 따른, 간세포암 예측 방법의 흐름도이다.
도 2는, 본 발명의 일 실시예에 따른, 예측 모델의 네트워크 구조도이다.
도 3은, 본 발명의 일 실험예에 따른, 검증 데이터 세트 내 위험 그룹에 따른 예측 모델의 성능을 평가한 도면이다.
도 4는, 본 발명의 일 실험에에 따른, 3명의 실험 대상 환자의 예측 결과를 도시한 도면이다.
여기서 사용되는 전문 용어는 단지 특정 실시예를 언급하기 위한 것이며, 본 발명을 한정하는 것을 의도하지 않는다. 여기서 사용되는 단수 형태들은 문구들이 이와 명백히 반대의 의미를 나타내지 않는 한 복수 형태들도 포함한다. 명세서에서 사용되는 "포함하는"의 의미는 특정 특성, 영역, 정수, 단계, 동작, 요소 및/또는 성분을 구체화하며, 다른 특성, 영역, 정수, 단계, 동작, 요소 및/또는 성분의 존재나 부가를 제외시키는 것은 아니다.
다르게 정의하지는 않았지만, 여기에 사용되는 기술용어 및 과학용어를 포함하는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 일반적으로 이해하는 의미와 동일한 의미를 가진다. 보통 사용되는 사전에 정의된 용어들은 관련기술문헌과 현재 개시된 내용에 부합하는 의미를 가지는 것으로 추가 해석되고, 정의되지 않는 한 이상적이거나 매우 공식적인 의미로 해석되지 않는다.
이하에서, 도면을 참조하여 본 발명의 실시예들에 대하여 상세히 살펴본다.
도 1은, 본 발명의 일 실시예에 따른, 간세포암 예측 방법의 흐름도이다.
도 1을 참조하면, 간세포암 예측 방법은 대상 환자의 속성 데이터를 획득하는 단계(S100)를 포함한다.
상기 대상 환자는 특히 HBV(Hepatitis B virus) 관련 간경변 환자일 수 있다.
상기 속성 데이터는 환자의 신체 상태에 관한 다양한 속성을 표현한 데이터로서, 상기 속성은 환자의 형식적 속성 및 간세포암 예측을 위해 보다 직접적으로 사용되는 실질적 속성을 포함한다. 상기 형식적 속성은, 예를 들어 연령, 성별, 키, 체중 중 하나 이상을 포함한다. 상기 실질적 속성은, 예를 들어, 간경변 유무, 당뇨병 유무, 혈소판 수, 혈청 빌리루빈, 혈청 알부민, HBV DNA 역가(titer), 내원일수 지표(index-visit)로부터 관찰 기간 중 하나 이상을 포함할 수도 있다.
여기서, 내원일수 지표는 엔터카바르(entecavir) 처방 첫날로부터 정의된다.
간경변 유무는 혈소판의 수, 간 가장자리의 영상, 문맥 고혈압의 존재, 및/또는 복수(ascites) 또는 간성 뇌병증과 같은 비보상 특징으로 정의된다. 여기서, 혈소판의 수는, 예를 들어 100,000/ mL 미만일 수도 있다. 상기 간 가장자리의 영상은 간경변 초음파 또는 단층 촬영을 통해 획득되는 것으로서, 12cm 초과의 비장 비대증을 갖는 둔각화된 간변연부(blunted liver edge)를 포함할 수도 있다. 문맥 고혈압은, 예를 들어 식도 또는 위 정맥류 등을 포함할 수도 있다.
당뇨병 유무는 포도당 정도에 관한 의료 기록 및/또는 항-당뇨 약물의 처방 이력에 의존한다.
상기 속성 데이터는 이진형 데이터 및 수치형 데이터로 이루어진다. 수치형 데이터는 연속 값을 가진다. 일 실시예에서, 이진형 데이터로 표현되는 속성은 성별 및/또는 당뇨병 유무을 포함할 수도 있다. 나머지 속성은 수치형 데이터로 표현된다. 예를 들어, 혈소판 수, 혈청 알부민 농도, 혈청 빌리루빈 농도, 비형 간염 바이러스(HBV) 농도의 속성 데이터는 연속 값으로 표현된다.
상기 간세포암 예측 방법은: 대상 환자의 속성 데이터를 예측 모델에 적용하여 대상 환자가 간세포암 환자인지 여부를 예측하는 단계(S300)를 포함한다.
상기 예측 모델은 심층 신경망(deep nueral network) 구조를 갖는 기계 학습 모델이다. 상기 예측 모델은, 예를 들어, RNN(Recurrent Neural Nerwork), CNN(Convolutional Neural Network), ResNet(Residual Network) 등의 신경망 구조를 가질 수도 있으나, 이에 제한되진 않는다.
도 2는, 본 발명의 일 실시예에 따른, 예측 모델의 네트워크 구조도이다.
도 2를 참조하면, 상기 예측 모델은 복수의 잔차 블록(residual block)을 포함한다. 적어도 하나의 잔차 블록은 다른 잔차 블록의 출력 값을 입력 값으로 수신할 수 있다. 예를 들어, 상기 예측 모델은 2개의 잔차 블록을 포함할 수도 있다. 도 2의 제2 잔차 블록은 제1 잔차 블록의 출력 값을 입력 값으로 수신한다.
상기 잔차 블록은 심층 구조(deep structure)를 갖는 CNN 기반 모델에 있어 기존의 스택 구조(stacked structure)에 일종의 스킵 연결(skip connection)(또는 숏컷(shortcut) 연결로 지칭됨)을 추가한 구조를 가진다. 잔차 블록에서는 입력이 x이면, 최종적으로 학습해야할 데이터는 H(x)이다. 상기 H(x)는 F(x) + x로서, F(x) = H(x) - x로 표현될 수 있다. 따라서, 잔차 블록은 가중치 레이어를 통해 쌓여진 출력 H(x)와 입력 간의 잔차(residual)를 학습함으로써 결과적으로 원래 학습을 의도한 결과 F(x)를 얻을 수 있다. 이와 같이, 잔차만 학습하면 되는 잔차 학습 블록 구조를 갖는 CNN 모델의 학습은 잔차 학습(residual learning)으로 지칭될 수 있다.
상기 예측 모델 내 복수의 잔차 블록 각각은 복수의 레이어 배열을 각각 포함한다. 상기 레이어 배열은 완전 연결층을 포함한다.
완전 연결층은 인간의 신경망의 뉴런에 대응하는 복수의 노드로 이루어진 계층이다. 완전 연결층 내에서 인접한 층 간의 복수의 노드는 완전 연결되고, 연결 가중치가 개별적으로 설정될 수 있다.
또한, 레이어 배열은 배치 정규화층, 활성화층 및 드롭-아웃층 중 하나 이상을 상기 완전 연결층의 후행 레이어로서 더 포함할 수도 있다. 예를 들어, 도 2에 도시된 바와 같이 잔차 블록은 완전 연결층, 배치 정규화층 활성화층 및 드롭-아웃층 순서로 이루어진 레이어 배열을 가질 수도 있다.
활성화 레이어는 활성화 함수를 적용하여 입력 값을 대체하도록 구성된다. 활성화층은 이전 레이어의 모든 입력에 대한 연산 결과(예컨대, 가중 합)을 취하고 출력 값을 생성하여 다음 레이어로 전달한다. 상기 활성화 레이어는 활성화 함수로서, ReLU 또는 Sigmoid 함수를 이용하여 입력 값을 대체할 수도 있다.
상기 잔차 블록은 배치 정규화층 및/또는 드롭 아웃층을 통해 학습 단계에서 오버 피팅을 감소시키는 정규화 동작을 수행한다.
기계 학습 모델의 레이어가 많아지거나 깊어질수록 학습이 어려워진다. 각 노드의 가중치의 미세한 변화들이 누적되게 되고, 결국 은닉 레이어(Hidden layer)의 수가 증가함으로써 가중치의 값의 변화 폭이 증가한다. 가중치 값의 변화는 다음 레이어에 대한 입력 값의 분포를 변화시킨다. 이러한 문제는 통상적으로 내부 공변량 변이(Internal Covariate Shift)로 지칭된다.
이와 같이, 이전 레이어의 파라미터 변화로 인한 각 레이어의 입력 값의 분포 변화로 인해, 파라미터의 학습 과정에서 가중치 소실(Gradient Vanaching) 또는 가중치 폭발(Gradient Exploding)이 발생하는 문제가 있다.
배치 정규화 레이어(Batch Normalization layer)는 네트워크 연산 결과가 원하는 방향(즉, 학습 목적)의 분포 대로 산출되게 한다. 배치 정규화 레이어는 입력 값의 분포(distribution)를 평균 0, 표준 편차 1인 분포로 정규화하도록 구성된다. 이 과정에서 배치 정규화 레이어는 정규화된 값에 크기 인자(scale factor)와 변이 인자(shift factor)가 추가된다. 크기 인자와 변이 인자는 예측 모델의 학습에 의해 결정되는 파라미터이다. 크기 인자와 변이 인자로 인해 활성화 함수의 비선형성을 제거할 수 있다.
상기 배치 정규화 레이어는 (특히, 가중치 초기 값을 크게 고려하지 않고도) 가중치 소실 또는 가중치 폭발을 방지할 수 있다. 상기 배치 정규화 레이어로 인해, 내부 공변량 변이(Internal Covariate Shift)의 문제가 제거되고 깊은 레이어 구조를 갖는 모델을 빠르게 학습 가능하다.
상기 드랍-아웃 레이어는 모델의 네트워크의 일부를 생략하도록 동작한다. 상기 네트워크의 일부 생략은 무작위로 구현될 수 있다.
상기 드랍-아웃 레이어에 의해 생략된 모델은 모두 파라미터를 공유하고 있기 때문에, 상기 드랍-아웃 레이어는 각각의 뉴런이 존속할 비율을 각각의 가중치에 곱하는 형태를 가진다. 상기 보다 적은 비율은 예를 들어, 50% 이하의 확률 값으로서, 예를 들어 20%, 30% 등일 수 있으나, 이에 제한되진 않는다.
상기 드랍-아웃 레이어에 의해, 과적합(Overfitting)을 줄일 수 있다.
이러한 내부 층을 포함한 레이어 배열은 다른 레이어 배열과 적어도 일부가 동일할 수도 있다. 예를 들어, 도 2에 도시된 바와 같이 잔차 블록은 3개의 레이어 배열을 포함하고, 각 레이어 배열은 완전 연결층, 배치 정규화층, 활성화층, 및 드롭 아웃층을 포함할 수도 있다.
동일한 단일 잔차 블록 내 다수의 레이어 배열 중에서 가장 후행 레이어 배열의 출력이 가장 선행 레이어 배열의 입력과 합산되도록 가장 후행 레이어 배열과 상기 가장 선행 레이어 배열이 잔차 연결된다. 예측 모델에서 모델의 입력 데이터가 가장 먼저 입력되는 잔차 블록은 초기 완전 연결층으로 지칭된다. 동일한 잔차 블록에서 블록의 입력 데이터가 가장 먼저 입력되는 완전 연결층은 초기 완전 연결층으로 지칭된다.
상기 레이어 배열에서 일부와 다른 일부는 서로 다른 채널을 갖도록 구성될 수도 있다. 예를 들어, 3개의 레이어 배열 중 제1 레이어 배열과 제3 레이어 배열은 16개의 채널을 가지나, 제2 레이어 배열은 64개의 채널을 갖도록 구성될 수도 있다.
일 실시예에서, 환자의 속성 데이터가 최초로 입력되는 초기 잔차 블록 내 초기 완전 연결층은 복수의 입력 노드를 포함한다. 입력 변수, 즉 속성 데이터 각각은 해당 속성별로 할당된 자체 입력 노드에 입력된다.
예를 들어, 성별, 연령, 혈소판 수, 혈청 알부민, 혈청 빌리루빈, HBV DNA 역가, 당뇨병 유무 및 내원일수 지표로부터의 관찰 기간을 포함한 대상 환자의 속성 데이터가 입력되면, 상기 초기 잔차 블록의 초기 완전 연결층은 8개의 속성에 각각 대응하는 8개의 입력 노드를 포함할 수도 있다.
이를 위해, 일부 실시예에서, 예측 모델에 입력되는 대상 환자의 속성 데이터는 해당 입력 노드에 입력되도록 미리 배열될 수도 있다.
이진형 데이터에 할당된 해당 입력 노드(예컨대, 성별, 당뇨병 유무 등을 위한 입력 노드)는 이진형 데이터를 그대로 입력 받는다. 또한, 수치형 데이터에 할당된 해당 입력 노드(예컨대, 혈소판 수, 혈청 알부민, 혈청 빌리루빈, HBV DNA 역가, 내원일수 지표로부터의 관찰 기간)는 특정 컷 오프 값으로 분류되지 않고 연속 값 그대로 입력된다.
이와 같이, 각각의 속성 데이터, 즉 입력 변수가 자체 입력 노드에 입력됨으로써, 변수형 데이터와 수치형 데이터로 이루어진 대상 환자의 속성 데이터가 예측 모델에 입력되어도 예측 동작 과정에서 일 유형의 데이터가 다른 유형의 데이터의 영향을 받지 않는다.
상기 예측 모델에서 마지막 잔차 블록은 2차원 데이터 배열을 출력한다. 예측 모델은 상기 2차원 데이터 배열에 기초하여 상기 대상 환자가 간세포암을 갖는 환자인지를 분류하기 위한 판단 값을 산출한다. 상기 예측 모델은 판단 값에 기초하여 입력된 환자 정보를 갖는 환자가 간암 환자에 해당할지 여부를 결정한다.
일 실시예에서, 상기 예측 모델은 상기 2차원 데이터 배열에 softmax 함수를 적용하여 0과 1 사이의 확률 값을 판단 값으로 산출할 수도 있다. 예측 모델은 상기 확률 값이 미리 지정된 임계 함수 이상인 경우 간세포암 환자로 분류된다.
상기 예측 모델은 복수의 훈련 데이터 세트를 사용하여 학습된다. 사용된 훈련 데이터 세트의 속성에 대응하는 대상 환자의 속성 데이터가 예측 모델에 입력된다.
예를 들어, 훈련 환자별 훈련 데이터 각각은 성별, 연령, 혈소판 수, 혈청 알부민, 혈청 빌리루빈, HBV DNA 역가, 당뇨병 유무 및 내원일수 지표로부터의 관찰 기간을 포함한 속성 데이터가 입력되면, 상기 초기 잔차 블록의 초기 완전 연결층은 8개의 속성에 대한 데이터를 포함할 수도 있다.
이와 같이, 예측 모델은 이미지 데이터 세트가 아닌 상대적으로 적은 수의 숫자 데이터 포인트를 사용하여 학습됨으로써, 다중 GPU 없이도 일반 랩톱 컴퓨터에서도 쉽게 구현될 수 있는 사양을 가진다.
상기 예측 모델의 파라미터는 예측 모델의 손실 함수가 최소화되는 방향으로 업데이트된다.
상기 훈련 데이터 세트 내 각각의 훈련 데이터가 손실 함수에 입력됨으로써, 연결 가중치, 임계 함수 등의 예측 모델의 파라미터는 해당 모델의 손실 함수가 최소화되는 방향으로 업데이트된다.
여기서, 손실 함수는 모델에서 내놓는 결과 값과 실제 결과 값의 차이에 의존한다. 예를 들어, 상기 손실 함수는 가중치 교차 엔트로피 함수일 수도 있다. 그러면, 클래스 불균형이 제어되도록 학습된다.
이러한 파라미터의 업데이트는 통상적으로 최적화로 지칭된다. 일 예에서, 파라미터 최적화는 ADAM(Adaptive Moment Estimation)을 통해 수행될 수 있으나, 이에 제한되지 않으며, Momentum, NAG(Nesterov Accelerated Gradient), Adagrad(Adaptive Gradient), RMSProp 등과 같은 다양한 경사 하강(gradient discent) 방식에 의해 수행될 수도 있다.
상기 예측 모델 내 잔차 블록은 전술한 잔여 학습을 통해 학습된다. 예측 모델 내 모든 스택 레이어에 대해서 잔여 학습이 수행되고, 잔여 학습은 스택 레이어의 연결을 통해 완료된다. 각 레이어의 다음 입력 및 출력 변수를 통합하여 추가 비선형성을 제공하고 추가로 생성되는 가중치를 감소시켜 학습 성능을 향상시킨다. 숏컷 구조를 갖는 잔차 블록에 대해서는 숏컷 연결로 구현된 센터링 레이어의 응답(centering layer responses), 전파된 오차에 의해 손실 함수의 값이 최소화됨으로써 학습 성능이 개선된다.
이와 같이 학습된 예측 모델을 사용하여, 대상 환자가 간세포암을 갖는 환자인지 예측하고, 그 결과를 사용자에게 제공할 수도 있다(S300).
종래에 환자가 간세포암을 갖는지 여부는 각 모델에는 나이, 성별, 혈소판 수, 혈청 알부민, 혈청 빌리루빈, HBV DNA 역가, 간경변 유무, 당뇨병 유무, 및 인종과 같이 초기 병원 방문시 쉽게 얻을 수있는 간세포암의 발병과 유의한 연관성을 보여주는 3 ~ 6 개의 일부 속성을 사용하여 예측되었다. 그러나, 본 발명의 실시예들은 간세포암의 발병과 연관성을 갖는 모든 속성을 사용하여 보다 정확하게 예측할 수도 있다.
한편, 본 발명의 일 실시예에서는, 대상 환자의 속성 데이터를 획득하는 획득부; 및 미리 학습된 예측 모델에 상기 복수의 속성 데이터를 적용하여 대상 환자가 간세포암 환자인지 예측하는 예측부를 포함하고, 상기 대상 환자는 HBV(Hepatitis B virus) 관련 간경변 환자인, 간세포암 예측 시스템을 제공할 수 있다. 각 획득부 및 예측부에서 수행하는 단계에 대한 설명은 전술한 바와 같으므로 생략한다.
실시예들에 따른 간세포암 예측 방법을 수행하는 시스템은 전적으로 하드웨어이거나, 전적으로 소프트웨어이거나, 또는 부분적으로 하드웨어이고 부분적으로 소프트웨어인 측면을 가질 수 있다. 예컨대, 시스템은 데이터 처리 능력이 구비된 하드웨어 및 이를 구동시키기 위한 운용 소프트웨어를 통칭할 수 있다. 본 명세서에서 "부(unit)", “모듈(module)”“장치”, 또는 "시스템" 등의 용어는 하드웨어 및 해당 하드웨어에 의해 구동되는 소프트웨어의 조합을 지칭하는 것으로 의도된다. 예를 들어, 하드웨어는 CPU(Central Processing Unit), GPU(Graphic Processing Unit) 또는 다른 프로세서(processor)를 포함하는 데이터 처리 기기일 수 있다. 또한, 소프트웨어는 실행중인 프로세스, 객체(object), 실행파일(executable), 실행 스레드(thread of execution), 프로그램(program) 등을 지칭할 수 있다.
상기 시스템이 본 명세서에 서술되지 않은 다른 구성요소를 포함할 수도 있다는 것이 통상의 기술자에게 명백할 것이다. 예를 들어, 상기 시스템은 네트워크 인터페이스, 데이터 엔트리를 위한 입력 장치, 및 디스플레이, 인쇄 또는 다른 데이터 표시를 위한 출력 장치를 포함하는, 본 명세서에 서술된 동작에 필요한 다른 하드웨어 요소를 포함할 수도 있다.
실험예
도 3 및 도 4는, 본 발명의 일 실험예에 따른, 도 2의 모델의 성능을 설명하기 위한 도면이다.
상기 실험예에서, 심층 신경망은 텐서플로우(TensorFlow) 1.13 버전을 기준으로 구성하였다. Adam 최적화 알고리즘을 사용하여 모델을 최적화하였다. 훈련 데이터 세트 내 클래스 불균형을 제어하기 위해 손실 함수로 가중치 교차 엔트로피를 구현하였다. 활성화 함수로 ReLU (parametric rectified linear unit)를 사용했다. 드롭 아웃과 함께 배치 정규화를 적용하였다. 이러한 예측 모델의 성능은 아래의 표 1의 특징을 갖는 검증 데이터 세트를 사용하여 평가되었다. 이 검증 데이터 세트는 중앙값 6.4 년의 추적 기간 동안 68명의 간세포암 환자를 포함한다.
Figure PCTKR2020015475-appb-img-000001
도 3은, 본 발명의 일 실험예에 따른, 검증 데이터 세트 내 위험 그룹에 따른 예측 모델의 성능을 평가한 도면이다.
도 3에서 예측 모델의 임계 확률은 0.5로 지정되었다. 검증 환자의 속성 데이터를 예측 모델에 적용하여 검증 환자를 두 그룹으로 분류하였다. 고위험군(≥0.5)은 저위험군(<0.5) 보다 간세포암의 발병률이 실제로도 유의미하게 높았다.
도 4는, 본 발명의 일 실험에에 따른, 3명의 실험 대상 환자의 예측 결과를 도시한 도면이다.
도 4를 참조하면, 아래의 표 2의 속성 데이터를 갖는 3명의 실험 대상 환자를 적용한 결과 실제 간세포암 환자로 추후에 진단된 제2 및 제3 환자에 대해서는 추적 기간이 지남에 따라 간세포암 환자로 예측될 확률이 높아지는 것이 확인되었다.
Figure PCTKR2020015475-appb-img-000002
이상에서 설명한 실시예들에 따른 간세포암 예측 방법 및 이를 수행하는 시스템에 의한 동작은 적어도 부분적으로 컴퓨터 프로그램으로 구현되어, 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 예를 들어, 프로그램 코드를 포함하는 컴퓨터-판독가능 매체로 구성되는 프로그램 제품과 함께 구현되고, 이는 기술된 임의의 또는 모든 단계, 동작, 또는 과정을 수행하기 위한 프로세서에 의해 실행될 수 있다.
상기 컴퓨터는 데스크탑 컴퓨터, 랩탑 컴퓨터, 노트북, 스마트 폰, 또는 이와 유사한 것과 같은 컴퓨팅 장치일 수도 있고 통합될 수도 있는 임의의 장치일 수 있다. 컴퓨터는 하나 이상의 대체적이고 특별한 목적의 프로세서, 메모리, 저장공간, 및 네트워킹 구성요소(무선 또는 유선 중 어느 하나)를 가지는 장치다. 상기 컴퓨터는 예를 들어, 마이크로소프트의 윈도우와 호환되는 운영 체제, 애플 OS X 또는 iOS, 리눅스 배포판(Linux distribution), 또는 구글의 안드로이드 OS와 같은 운영체제(operating system)를 실행할 수 있다.
상기 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록신원확인 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장신원확인 장치 등을 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.
이상에서 살펴본 본 발명은 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해서 정해져야 할 것이다.
본 발명의 실시예들은 미리 학습된 기계 학습 모델을 이용하여 대상 환자 특히 HBV(Hepatitis B virus) 관련 간경변 환자가 간세포암을 갖는 환자인지 예측하는 방법 및 이를 수행하는 시스템에 관련된다.

Claims (10)

  1. 프로세서에 의해 수행되는 간세포암 예측 방법에 있어서,
    대상 환자의 속성 데이터를 획득하는 단계; 및
    미리 학습된 예측 모델에 상기 복수의 속성 데이터를 적용하여 대상 환자가 간세포암 환자인지 예측하는 단계를 포함하되,
    상기 대상 환자는 HBV(Hepatitis B virus) 관련 간경변 환자인 것을 특징으로 하는, 간세포암 예측 방법.
  2. 제1항에 있어서,
    상기 속성 데이터는 이진형 데이터 및 수치형 데이터를 포함하며,
    상기 수치형 데이터는 연속 값으로 초기 잔차 블록 내 초기 완전 연결층에 입력되는 것을 특징으로 하는 간세포암 예측 방법.
  3. 제1항에 있어서,
    상기 예측 모델은 복수의 잔차 블록을 포함하고 각 잔차 블록은 복수의 레이어 배열을 각각 포함하고, 상기 복수의 레이어 배열은 완전 연결층을 각각 포함하며,
    동일한 잔차 블록 내에서 가장 후행 레이어 배열의 출력이 가장 선행 레이어 배열의 입력과 합산되도록 가장 후행 레이어 배열과 상기 가장 선행 레이어 배열이 잔차 연결된 것을 특징으로 하는 간세포암 예측 방법.
  4. 제2항에 있어서,
    상기 초기 완전 연결층은 복수의 노드를 포함하고, 상기 복수의 노드에 상기 복수의 속성이 각각 미리 할당되어 각각의 속성 데이터는 해당 노드에 각각 입력되는 것을 특징으로 하는 간세포암 예측 방법.
  5. 제3항에 있어서,
    상기 레이어 배열은 상기 완전 연결층의 후행 레이어로서 배치 정규화 레이어, 활성화 레이어 및 드롭-아웃 레이어 중 적어도 하나를 더 포함하는 것을 특징으로 하는 간세포암 예측 방법.
  6. 제3항에 있어서,
    상기 예측 모델은 제1 잔차 블록 및 제2 잔차 블록을 포함하고,
    상기 제1 잔차 블록 및 제2 잔차 블록 중 적어도 하나는 적어도 제1 내지 제3 레이어 배열을 포함하며,
    상기 제1 내지 제3 레이어 배열 각각은 완전 연결 레이어, 배치 정규화 레이어, 활성화 레이어 및 드롭-아웃 레이어를 포함하는 것을 특징으로 하는 간세포암 예측 방법.
  7. 제2항에 있어서,
    상기 복수의 속성은 나이, 성별, 혈소판 수, 혈청 알부민 농도, 혈청 빌리루빈 농도, 비형 간염 바이러스(HBV) 농도, 당뇨병 유무 및 추적관찰기간 중 적어도 일부를 포함하며,
    상기 성별 및 당뇨병 유무의 속성은 이진형 데이터로 표현되고, 나머지 속성은 수치형 데이터로 표현되는 것을 특징으로 하는 간세포암 예측 방법.
  8. 제3항에 있어서,
    상기 예측 모델의 최종 잔차 블록은 2차원 데이터 배열을 출력하고,
    상기 예측 모델은 상기 2차원 데이터 배열에 기초하여 상기 대상 환자가 간세포암을 가질 확률을 산출하며,
    산출된 확률이 소정 임계 확률 보다 큰 경우, 대상 환자가 간세포암을 갖고 있는 것으로 판단하는 것을 특징으로 하는 간세포암 예측 방법.
  9. 제1항 내지 제8항 중 어느 하나의 항에 따른 간세포암 예측 방법을 수행하기 위한, 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 기록매체.
  10. 간세포암 예측 시스템에 있어서,
    대상 환자의 속성 데이터를 획득하는 획득부; 및
    미리 학습된 예측 모델에 상기 복수의 속성 데이터를 적용하여 대상 환자가 간세포암 환자인지 예측하는 예측부를 포함하고,
    상기 대상 환자는 HBV(Hepatitis B virus) 관련 간경변 환자인 것을 특징으로 하는 간세포암 예측 시스템.
PCT/KR2020/015475 2019-11-06 2020-11-06 기계 학습 모델을 이용한 간세포암 예측 방법 및 시스템 Ceased WO2021091288A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20190141009 2019-11-06
KR10-2019-0141009 2019-11-06
KR10-2020-0139340 2020-10-26
KR1020200139340A KR20210054987A (ko) 2019-11-06 2020-10-26 기계 학습 모델을 이용한 간세포암 예측 방법 및 시스템

Publications (1)

Publication Number Publication Date
WO2021091288A1 true WO2021091288A1 (ko) 2021-05-14

Family

ID=75848921

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/015475 Ceased WO2021091288A1 (ko) 2019-11-06 2020-11-06 기계 학습 모델을 이용한 간세포암 예측 방법 및 시스템

Country Status (1)

Country Link
WO (1) WO2021091288A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113611410A (zh) * 2021-09-08 2021-11-05 温州医科大学附属第一医院 一种脂肪性肝炎风险诊断设备、系统及其残差网络的训练方法
WO2024209473A1 (en) 2023-04-04 2024-10-10 Yeda Research And Development Co. Ltd. Method and system for predicting liver associated disease

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120055252A (ko) * 2010-11-23 2012-05-31 (주)진매트릭스 만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120055252A (ko) * 2010-11-23 2012-05-31 (주)진매트릭스 만성 b형 간질환 환자의 간세포암 발병 위험도 분석 및 예측방법

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
KIM JI HYUN, KIM YOUNG DON, LEE MINJONG, GYU JUN BAEK, KIM TAE SUK, SUK KI TAE, KANG SEONG HEE, CHEON GAB JIN, KIM DONG JOON, SOON: "Modified PAGE-B score predicts the risk of hepatocellular carcinoma in Asians with chronic hepatitis B on antiviral therapy", JOURNAL OF HEPATOLOGY, vol. 69, no. 5, 1 November 2018 (2018-11-01), pages 1066 - 1073, XP055810820, DOI: 10.1016/j.jhep.2018.07.018 *
LEI BI, JINMAN KIM, ASHNIL KUMAR, DAGAN FENG: "Automatic liver lesion detection using cascaded deep residual networks", COMPUTER VISION AND PATTERN RECOGNITION, 10 April 2017 (2017-04-10), pages 1 - 6, XP055634597 *
NAM JOON YEUL, SINN DONG HYUN, BAE JUNHO, JANG EUN SUN, KIM JIN-WOOK, JEONG SOOK-HYANG: "Deep learning model for prediction of hepatocellular carcinoma in patients with HBV-related cirrhosis on antiviral therapy", JHEP REPORTS, vol. 2, no. 6, 1 December 2020 (2020-12-01), pages 1066 - 1073, XP055810853, ISSN: 2589-5559, DOI: 10.1016/j.jhepr.2020.100175 *
NAM, J. Y: "New prediction model of machine learning for hepatocellular carcinoma in patients of hepatitis B virus-related cirrhosis on potent antiviral therapy with comparison of preexisting medels", THE LIVER MEETING 2018, 10 November 2018 (2018-11-10) *
PENG JIE; KANG SHUAI; NING ZHENGYUAN; DENG HANGXIA; SHEN JINGXIAN; XU YIKAI; ZHANG JING; ZHAO WEI; LI XINLING; GONG WUXING; HUANG : "Residual convolutional neural network for predicting response of transarterial chemoembolization in hepatocellular carcinoma from CT imaging", EUROPEAN RADIOLOGY, vol. 30, no. 1, 22 July 2019 (2019-07-22), pages 413 - 424, XP036963581, ISSN: 0938-7994, DOI: 10.1007/s0330-019-06318-1 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113611410A (zh) * 2021-09-08 2021-11-05 温州医科大学附属第一医院 一种脂肪性肝炎风险诊断设备、系统及其残差网络的训练方法
WO2024209473A1 (en) 2023-04-04 2024-10-10 Yeda Research And Development Co. Ltd. Method and system for predicting liver associated disease

Similar Documents

Publication Publication Date Title
Quiroz-Juárez et al. Identification of high-risk COVID-19 patients using machine learning
Ikemura et al. Using automated machine learning to predict the mortality of patients with COVID-19: prediction model development study
Wojtara et al. Artificial intelligence in rare disease diagnosis and treatment
Shazia et al. A comparative study of multiple neural network for detection of COVID-19 on chest X-ray
Matava et al. A convolutional neural network for real time classification, identification, and labelling of vocal cord and tracheal using laryngoscopy and bronchoscopy video
Zeiberg et al. Machine learning for patient risk stratification for acute respiratory distress syndrome
EP3489957B1 (en) Accelerated clinical biomarker prediction (acbp) platform
WO2019164064A1 (ko) 정제된 인공지능 강화학습 데이터 생성을 통한 의료영상 판독 시스템 및 그 방법
Che et al. Learning robust representation for joint grading of ophthalmic diseases via adaptive curriculum and feature disentanglement
Mishra et al. An enhanced approach for analyzing the performance of heart stroke prediction with machine learning techniques
US11809826B2 (en) Assertion detection in multi-labelled clinical text using scope localization
WO2021091288A1 (ko) 기계 학습 모델을 이용한 간세포암 예측 방법 및 시스템
Reina Reina et al. Machine learning model from a Spanish cohort for prediction of SARS-COV-2 mortality risk and critical patients
Fernandes et al. Classification of the disposition of patients hospitalized with COVID-19: reading discharge summaries using natural language processing
Liu et al. Early prediction of MODS interventions in the intensive care unit using machine learning
WO2023106498A1 (ko) 다중 필터링을 이용한 개인정보 탐지 강화 방법 및 장치
Rashid et al. Advancing the Understanding of Clinical Sepsis Using Gene Expression–driven Machine Learning to Improve Patient Outcomes
Agraz et al. Enhancing severe hypoglycemia prediction in type 2 diabetes mellitus through multi-view co-training machine learning model for imbalanced dataset
Duran et al. The promise of machine learning approaches to capture cellular senescence heterogeneity
Dong et al. TCKAN: a novel integrated network model for predicting mortality risk in sepsis patients
Rajendran et al. Prescreening and triage of COVID-19 patients through chest X-ray images using deep learning model
Bathla et al. Artificial Intelligence in Healthcare: Emphasis on Diabetes, Hypertension, and Depression Management
Rajeshwari et al. Skin cancer severity prediction model based on modified deep neural network with horse herd optimization
Cara et al. An Artificial Intelligence Model for Predicting Hospital Readmission Using Electronic Health Records Data
Qi et al. A deep neural network prediction method for diabetes based on Kendall’s correlation coefficient and attention mechanism

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20885982

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20885982

Country of ref document: EP

Kind code of ref document: A1