[go: up one dir, main page]

KR101289948B1 - Method and apparatus for classification of ligand by using molecular vibrational frequency patterns - Google Patents

Method and apparatus for classification of ligand by using molecular vibrational frequency patterns Download PDF

Info

Publication number
KR101289948B1
KR101289948B1 KR1020120062277A KR20120062277A KR101289948B1 KR 101289948 B1 KR101289948 B1 KR 101289948B1 KR 1020120062277 A KR1020120062277 A KR 1020120062277A KR 20120062277 A KR20120062277 A KR 20120062277A KR 101289948 B1 KR101289948 B1 KR 101289948B1
Authority
KR
South Korea
Prior art keywords
ligand
candidate
candidate ligand
antagonist
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020120062277A
Other languages
Korean (ko)
Inventor
오석준
Original Assignee
인제대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인제대학교 산학협력단 filed Critical 인제대학교 산학협력단
Priority to KR1020120062277A priority Critical patent/KR101289948B1/en
Application granted granted Critical
Publication of KR101289948B1 publication Critical patent/KR101289948B1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • G01N2333/4701Details
    • G01N2333/4719G-proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/72Assays involving receptors, cell surface antigens or cell surface determinants for hormones
    • G01N2333/726G protein coupled receptor, e.g. TSHR-thyrotropin-receptor, LH/hCG receptor, FSH

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 후보 리간드의 3차원 구조 데이터 정보를 획득하는 단계; 상기 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하는 단계; 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하는 단계; 및 상기 진동수를 이용하여 후보 리간드의 작용을 예측하는 단계를 포함하는 리간드 분류 방법에 관한 것이다.
본 발명의 리간드 분류 방법에 따르면, 리간드 분자 고유의 분자 진동수 패턴을 이용하여 리간드가 실제 수용체에 작용할 때 작용제(agonist)로 작용할지 길항제(antagonist)로 작용할지 여부를 간편하게 예측, 분석할 수 있어, 다양한 후보 리간드의 작용 양상을 실험을 거치지 않고 예측이 가능하다.
The present invention includes the steps of obtaining three-dimensional structural data information of the candidate ligand; Geometrically optimizing the data to convert the structure of the candidate ligand into a structure with a minimum energy level; Calculating the frequencies of candidate ligand molecules of the converted minimum energy level state structure; And predicting the action of a candidate ligand using the frequency.
According to the ligand classification method of the present invention, the molecular frequency pattern inherent to the ligand molecule can be used to easily predict and analyze whether the ligand acts as an agonist or an antagonist when the ligand acts on the actual receptor. The behavior of various candidate ligands can be predicted without going through experiments.

Description

분자 진동수 패턴을 이용한 리간드 분류 방법 및 장치{Method and Apparatus for Classification of Ligand by Using Molecular Vibrational Frequency Patterns}Ligand classification method and apparatus using molecular frequency pattern {Method and Apparatus for Classification of Ligand by Using Molecular Vibrational Frequency Patterns}

본 발명은 분자 진동수 패턴을 이용한 리간드 분류 방법, 분류 장치 및 리간드 분류 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체에 관한 것이다.The present invention relates to a ligand classifying method using a molecular frequency pattern, a classifying apparatus, and a computer readable medium recording a ligand classifying program.

G-단백질-연결 수용체(G protein-coupled receptor, GPCR)는 세포막 수용체를 구성하는 큰 그룹으로, 작동자의 자극에 의해 반응하여 G-단백질을 활성화시키고, 그 결과 고리형 AMP/단백질 키나아제 A 케스케이드와 같은 적어도 하나의 신호전달 케스케이드를 활성화시킨다. 이 커다란 수용체 집단은 효모로부터 사람에 이르기까지 유기체에서 널리 발견되며, 예컨대, 호르몬, 신경 및 후각 신호의 변환에 관여한다. G protein-coupled receptors (GPCRs) are a large group of membrane receptors that activate G-proteins in response to stimulation of the operator, resulting in the cyclic AMP / protein kinase A cascade. Activate at least one signaling cascade. This large population of receptors is widely found in organisms from yeast to human beings and is involved in, for example, the transformation of hormones, nerves and olfactory signals.

G-단백질-연결 수용체(G protein-coupled receptor, GPCR)는 시장 유통중인 인간 대상 의약품의 25% 이상의 수용체로 작용함이 밝혀져 있다. GPCR을 타겟으로 하는 의약품은 전체 의약업계 시장의 40%의 시장 점유율을 보이는 주요 제품군에 해당한다. G protein-coupled receptors (GPCRs) have been shown to act as more than 25% of the receptors on the market for human drugs. Pharmaceuticals targeting GPCRs are a major product family with a market share of 40% of the overall pharmaceutical industry market.

GPCR은 막관통 단백질로, 다양한 길이의 3개의 세포간 및 3개의 세포외 루프로 연결된 7개의 막 관통 부분(segment)으로 구성되어 있다. GPCR의 결합 리간드의 결정 구조는 리간드와 결합하는 포켓 및 세포외 루프와 관련이 있음이 밝혀져 있다(Cherezov V, Rosenbaum DM, Hanson MA, Rasmussen SG, Thian FS, Kobilka TS, et al. High-resolution crystal structure of an engineered human beta2-adrenergic G protein-coupled receptor. Science. 2007;318(5854):1258-65.; Shimamura T, Shiroishi M, Weyand S, Tsujimoto H, Winter G, Katritch V, et al. Structure of the human histamine H1 receptor complex with doxepin. Nature. 2011;475(7354):65-70). GPCR의 리간드는 수용체 구조를 활성형으로 변화시키는 기작을 통해 수용체를 활성화시킨다. GPCR is a transmembrane protein, consisting of seven membrane segments connected by three intercellular and three extracellular loops of varying lengths. It has been found that the crystal structure of binding ligands of GPCRs is associated with pockets and extracellular loops that bind to ligands (Cherezov V, Rosenbaum DM, Hanson MA, Rasmussen SG, Thian FS, Kobilka TS, et al. structure of an engineered human beta2-adrenergic G protein-coupled receptor.Science. 2007; 318 (5854): 1258-65 .; Shimamura T, Shiroishi M, Weyand S, Tsujimoto H, Winter G, Katritch V, et al. of the human histamine H1 receptor complex with doxepin.Nature. 2011; 475 (7354): 65-70). Ligands in GPCRs activate receptors through a mechanism that changes the receptor structure to the active form.

GPCR의 리간드-수용체 상호작용의 분자적 기전은 아직 알려져 있지 않으며, 현재 많은 연구가 수행되고 있다. 상기 리간드-수용체 상호작용 기작을 설명하기 위하여, 모양 이론, 결합 이론 및 진동 이론과 같은 다양한 이론들이 제시되고 있다(Keller A, Vosshall LB. A psychophysical test of the vibration theory of olfaction. Nat Neurosci. 2004;7(4):337-8.; Takane SY, Mitchell JB. A structure-odour relationship study using EVA descriptors and hierarchical clustering. Org Biomol Chem. 2004;2(22):3250-5; 한국공개특허 10-2005-0029109호). The molecular mechanism of ligand-receptor interactions of GPCRs is not yet known and many studies are currently being conducted. To explain the ligand-receptor interaction mechanism, various theories such as shape theory, binding theory and vibration theory have been proposed (Keller A, Vosshall LB. A psychophysical test of the vibration theory of olfaction. Nat Neurosci. 2004; 7 (4): 337-8 .; Takane SY, Mitchell JB.A structure-odour relationship study using EVA descriptors and hierarchical clustering.Org Biomol Chem. 2004; 2 (22): 3250-5; Korean Patent Publication 10-2005 -0029109).

그러나, 히스타민 수용체 또는 아데노신 수용체와 같은 GPCR에 작용하는 리간드는 구조가 매우 다양하여, 구조적 분석으로 리간드의 작용 효과를 예측하는데는 한계가 있다. 또한, 실제 in vitro 실험 등이 수행되는 경우, 분리, 여과 및 세척과 같은 다단계의 준비과정을 거쳐야 한다는 번거로움이 있다. 따라서, GPCR 리간드의 작용 효과를 예측할 수 있는 보다 신속하고 간편한 방법의 개발이 요구되고 있다. However, ligands that act on GPCRs, such as histamine receptors or adenosine receptors, are highly diverse in structure, and there are limitations in predicting the effect of ligands by structural analysis. In addition, when actual in vitro experiments are performed, it is troublesome to go through a multi-step preparation process such as separation, filtration and washing. Therefore, there is a need for a faster and simpler method for predicting the effect of GPCR ligands.

이에 따라 본 발명의 발명자는 보다 신속하고 간편하게 G-단백질-연결 수용체 리간드의 작용 효과를 예측하고 분류하고자 연구한 결과, 리간드 분자 고유의 분자 진동수 패턴의 분석만으로 리간드의 작용 여부를 간단히 예측할 수 있음을 확인하고 본 발명을 완성하게 되었다. Accordingly, the inventors of the present invention have studied to predict and classify the effect of G-protein-linked receptor ligands more quickly and simply. As a result, it is possible to easily predict whether the ligands are only active by analyzing molecular frequency patterns inherent to the ligand molecules. It confirmed and completed this invention.

따라서 본 발명은 분자 진동수 패턴을 이용한 리간드 분류 방법, 분류 장치 및 리간드 분류 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체를 제공하는 것이다. Accordingly, the present invention provides a computer-readable medium recording a ligand classification method, a classification device, and a ligand classification program using a molecular frequency pattern.

상기 과제의 해결을 위해, 본 발명은 In order to solve the above problems, the present invention

후보 리간드의 3차원 구조 데이터 정보를 획득하는 단계; 상기 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하는 단계; 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하는 단계; 및 상기 진동수를 이용하여 후보 리간드의 작용을 예측하는 단계를 포함하는 리간드 분류 방법을 제공한다. Obtaining three-dimensional structural data information of the candidate ligand; Geometrically optimizing the data to convert the structure of the candidate ligand into a structure with a minimum energy level; Calculating the frequencies of candidate ligand molecules of the converted minimum energy level state structure; And it provides a ligand classification method comprising the step of predicting the action of the candidate ligand using the frequency.

또한 본 발명은 후보 리간드의 3차원 구조 데이터 정보를 입력받는 입력부; 상기 입력부로 입력된 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하는 제1연산부; 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하는 제2연산부; 상기 진동수를 이용하여 후보 리간드의 작용을 예측하는 제3연산부; 및 상기 제3연산부를 통해 예측된 후보 리간드의 작용이 출력되는 출력부를 포함하는 리간드 분류 장치를 제공한다. In another aspect, the present invention provides an input unit for receiving the three-dimensional structure data information of the candidate ligand; A first calculation unit which geometrically optimizes the data inputted to the input unit to convert the structure of the candidate ligand into a structure of a minimum energy level state; A second operation unit for calculating a frequency of candidate ligand molecules of the converted minimum energy level state structure; A third operation unit predicting the action of the candidate ligand using the frequency; And an output unit for outputting the action of the candidate ligand predicted through the third operation unit.

또한 본 발명은 컴퓨터 입력장치를 통해 후보 리간드의 3차원 구조 데이터 정보를 입력받는 단계; 컴퓨터 연산장치가 상기 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하도록 하는 단계; 컴퓨터 연산장치가 상기 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하도록 하는 단계; 컴퓨터의 연산장치가 상기 진동수를 이용하여 후보 리간드의 작용을 예측하게 하는 단계; 및 컴퓨터의 출력장치가 상기 연산잔치에 의해 예측된 후보 리간드의 작용을 출력하게 하는 단계를 실행시키기 위한 리간드 분류 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체를 제공한다. In addition, the present invention comprises the steps of receiving the three-dimensional structure data information of the candidate ligand through a computer input device; Causing the computer computing device to geometrically optimize the data to convert the structure of the candidate ligand into a structure of a minimum energy level; Causing a computer computing device to calculate frequencies of candidate ligand molecules of the transformed minimum energy level state structure; Causing a computing device of the computer to predict the action of a candidate ligand using the frequency; And a computer program for recording a ligand classification program for executing a step of causing an output device of the computer to output the action of the candidate ligand predicted by the operation residual.

본 발명의 리간드 분류 방법 및 분류 장치에 따르면, 리간드 분자 고유의 분자 진동수 패턴을 이용하여 리간드가 실제 수용체에 작용할 때 작용제로 작용할지 길항제로 작용할지 여부를 간편하게 예측, 분석할 수 있어, 다양한 후보 리간드의 작용 여부를 실험을 거치지 않고 예측이 가능하다. According to the ligand classification method and classification apparatus of the present invention, by using the molecular frequency pattern inherent to the ligand molecule, it is possible to easily predict and analyze whether the ligand acts as an agonist or an antagonist when the ligand acts on the actual receptor, and thus various candidate ligands. Whether or not can be predicted without going through experiments.

도 1은 본 발명에 따른 리간드 분류 방법이 도시된 순서도이다.
도 2는 본 발명에 따른 리간드 분류 장치의 구성이 도시된 블록도이다.
도 3은 본 발명의 일실시예에 따라 얻어진 분자 진동수의 일 예이다.
도 4은 본 발명의 일실시예에 따른 히스타민 수용체 결합 리간드의 계통도를 나타낸다.
도 5는 본 발명의 일실시예에 따른 아데노신 수용체 결합 리간드의 계통도를 나타낸다.
1 is a flowchart illustrating a ligand classification method according to the present invention.
Figure 2 is a block diagram showing the configuration of a ligand classification apparatus according to the present invention.
3 is an example of molecular frequency obtained in accordance with one embodiment of the present invention.
Figure 4 shows a schematic of the histamine receptor binding ligand according to an embodiment of the present invention.
Figure 5 shows a schematic of the adenosine receptor binding ligand according to an embodiment of the present invention.

본 발명은 후보 리간드의 3차원 구조 데이터 정보를 획득하는 단계; 상기 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하는 단계; 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하는 단계; 및 상기 진동수를 이용하여 후보 리간드의 작용을 예측하는 단계를 포함하는 리간드 분류 방법을 제공한다. The present invention includes the steps of obtaining three-dimensional structural data information of the candidate ligand; Geometrically optimizing the data to convert the structure of the candidate ligand into a structure with a minimum energy level; Calculating the frequencies of candidate ligand molecules of the converted minimum energy level state structure; And it provides a ligand classification method comprising the step of predicting the action of the candidate ligand using the frequency.

본 발명의 한 구체예에서, 상기 후보 리간드의 작용을 예측하는 단계는, 후보 리간드 및 본 리간드 분자의 진동수의 유사도를 비교하여 계통도를 구하는 단계일 수 있다. In one embodiment of the present invention, predicting the action of the candidate ligand may be a step of obtaining a schematic by comparing the similarity of the frequencies of the candidate ligand and the present ligand molecule.

본 발명의 다른 구체예에서, 상기 후보 리간드의 작용을 예측하는 단계는, 후보 리간드의 분자 진동수를 일정한 간격으로 나누는 단계; 동일 간격 구간에 존재하는 분자 진동수의 강도를 합산하여 그 구간의 대표값으로 하는 단계; 및 상기 대표값의 패턴을 바탕으로 본 리간드와의 유사도를 비교하여 계통도를 구하는 단계를 포함할 수 있다. In another embodiment of the present invention, predicting the action of the candidate ligands comprises: dividing the molecular frequencies of the candidate ligands at regular intervals; Summing the intensity of molecular frequencies present in the same interval section to form a representative value of the section; And comparing the similarity with the ligand based on the pattern of the representative value to obtain a systematic diagram.

본 발명의 또 다른 구체예에서, 상기 리간드는 로돕신(rhodopsin) 유사 G-단백질-연결 수용체(G protein-coupled receptor, GPCR) 결합 리간드일 수 있으며, 보다 구체적으로 상기 로돕신(rhodopsin) 유사 G-단백질-연결 수용체(G protein-coupled receptor, GPCR)는 히스타민 수용체 또는 아데노신 수용체일 수 있으나 이에 제한되는 것은 아니다. In another embodiment of the present invention, the ligand may be a rdopsin-like G-protein-coupled receptor (GPCR) binding ligand, more specifically the rhodopsin-like G-protein G protein-coupled receptors (GPCRs) may be, but are not limited to, histamine receptors or adenosine receptors.

본 발명에서, '후보 리간드'는 작용 효과를 알고자 하는 분석 대상 리간드이고, '본 리간드'는 본래 수용체에 결합하는 것으로 알려진 리간드를 의미한다. 본 발명의 일실시예에서, 수용체가 히스타민 수용체인 경우, 히스타민이 본 리간드가 되고, 수용체가 아데노신 수용체인 경우 본 리간드는 아데노신이 된다. 본 발명은 후보 리간드와 본 리간드의 진동수를 비교하여, 이의 유사성을 통해, 후보 리간드의 작용 효과를 예측하는 것이다. 본 리간드와의 진동수 패턴이 유사하게 나타나 계통도 상에서 인접하게 위치하는 경우, 후보 리간드는 작용제로 작용한다고 예측할 수 있으며, 반대의 경우 길항제로 작용한다고 예측할 수 있다. In the present invention, the 'candidate ligand' is a ligand to be analyzed to know the effect of the action, and the 'present ligand' means a ligand known to bind to the original receptor. In one embodiment of the present invention, when the receptor is a histamine receptor, the histamine is the present ligand, and when the receptor is the adenosine receptor, the ligand is adenosine. The present invention compares the frequency of the candidate ligand with the present ligand and predicts the effect of the candidate ligand through its similarity. If the frequency pattern with the present ligand appears similar and is located adjacent to the tree, the candidate ligand can be expected to act as an agonist and vice versa.

도 1은 본 발명의 일실시예에 따른 리간드 분류 방법이 도시된 순서도이다. 1 is a flow chart illustrating a ligand classification method according to an embodiment of the present invention.

이하 각 단계를 상세히 설명한다. Each step will be described in detail below.

후보 리간드의 3차원 구조 데이터 정보를 획득하는 단계는, 후보 리간드에 대해 일반적인 정보를 제공하는 웹사이트 등에서 다운로드 하는 방식으로 수행될 수 있으며, 보다 구체적으로 NCBI의 PubChem Compound Database로부터 다운로드 받을 수 있으나, 이에 제한되는 것은 아니다. Acquiring the three-dimensional structure data information of the candidate ligand may be performed by downloading from a website providing general information about the candidate ligand, and more specifically, it may be downloaded from NCBI's PubChem Compound Database. It is not limited.

상기 방법으로 얻어진 3차원 구조 데이터 정보는 최소 에너지 상태의 구조를 제공하는 것이 아니기 때문에, 이후 최소 에너지 상태로 후보 리간드의 구조를 변환하는 후보 리간드의 기하학적 최적화 단계가 수행된다. 이는 GAMESS 프로그램 패키지를 사용하여 제한된 하트리-포크 계산법(Restricted Hartree-Fock calculations)을 통해 수행될 수 있으나 이에 제한되는 것은 아니다. Since the three-dimensional structure data information obtained by the above method does not provide a structure of the minimum energy state, then a geometric optimization step of the candidate ligands for converting the structure of the candidate ligands into the minimum energy state is performed. This can be done via Restricted Hartree-Fock calculations using, but not limited to, the GAMESS program package.

이후 변환된 최소 에너지 준위 상태 구조의 후보 리간드 분자의 진동수가 측정된다. 이후 진동수를 보다 간편히 비교하기 위해, 후보 리간드의 분자 진동수를 일정한 간격으로 나누는 단계; 동일 간격 구간에 존재하는 분자 진동수의 강도를 합산하여 그 구간의 대표값으로 하는 단계가 수행된다(corralled intensity of molecular vibrational frequency, CIMVF). The frequency of the candidate ligand molecules of the transformed minimum energy level state structure is then measured. Thereafter, in order to more easily compare the frequencies, dividing the molecular frequencies of candidate ligands at regular intervals; A step of adding the intensities of molecular frequencies present in the same interval section to represent the representative value of the section (corralled intensity of molecular vibrational frequency, CIMVF) is performed.

상기 구간(corral 의 interval)은 계산상의 편의를 위하여 임의값으로 설정될 수 있으며, 보다 구체적으로, 3 내지 50의 범위 내의 자연수로 설정될 수 있고, 바람직하게는 결과의 정확도를 위해 5 내지 10으로 설정될 수 있으나 이에 제한되는 것은 아니다. The interval (corral interval) may be set to an arbitrary value for convenience of calculation, more specifically, to a natural number within the range of 3 to 50, preferably to 5 to 10 for the accuracy of the result. It may be set but is not limited thereto.

이후 상기 대표값의 패턴을 바탕으로 본 리간드와의 유사도를 비교하여 계통도를 구하는 단계가 수행된다. Thereafter, a step of obtaining a systematic diagram by comparing the similarity with the ligand based on the pattern of the representative value is performed.

리간드의 유사도를 비교하기 위하여 J-Express 등 군집화 (agglomerative hierarchical clustering; complete linkage) 응용 프로그램 등을 사용할 수 있으며, 계통도를 그리기 위해서는 TreeView 등의 프로그램을 사용하여 통상의 방법을 통해 계통도를 구할 수 있다. In order to compare the similarity of ligands, an application such as agglomerative hierarchical clustering (complete linkage) application such as J-Express can be used, and a tree diagram can be obtained through a conventional method using a program such as TreeView.

계통도에서 후보 물질이 본 리간드와 가까이 위치하는 경우, 후보 리간드는 작용제로 작용한다고 예측할 수 있으며, 반대의 경우 길항제로 작용한다고 예측할 수 있다.
When the candidate is located close to the present ligand in the schematic, it can be predicted that the candidate ligand acts as an agonist and vice versa.

본 발명은 또한 후보 리간드의 3차원 구조 데이터 정보를 입력받는 입력부; 상기 입력부로 입력된 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하는 제1연산부; 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하는 제2연산부; 상기 진동수를 이용하여 후보 리간드의 작용을 예측하는 제3연산부; 및 상기 제3연산부를 통해 예측된 후보 리간드의 작용이 출력되는 출력부를 포함하는 리간드 분류 장치를 제공한다. The present invention also includes an input unit for receiving three-dimensional structural data information of the candidate ligand; A first calculation unit which geometrically optimizes the data inputted to the input unit to convert the structure of the candidate ligand into a structure of a minimum energy level state; A second operation unit for calculating a frequency of candidate ligand molecules of the converted minimum energy level state structure; A third operation unit predicting the action of the candidate ligand using the frequency; And an output unit for outputting the action of the candidate ligand predicted through the third operation unit.

도 2는 본 발명에 따른 리간드 분류 장치의 구성이 도시된 블록도이다. Figure 2 is a block diagram showing the configuration of a ligand classification apparatus according to the present invention.

본 발명에 따른 리간드 분류 장치는 입력부(10)와, 연산부(20)와, 출력부(30)를 포함하여 구성된다. 또한 상기 연산부(20)은 제1연산부(21), 제2연산부(22) 및 제3연산부(23)를 포함하여 구성된다.The ligand classification apparatus according to the present invention includes an input unit 10, a calculation unit 20, and an output unit 30. In addition, the operation unit 20 includes a first operation unit 21, a second operation unit 22, and a third operation unit 23.

상기 입력부(10)는 키보드 또는 마우스 등의 입력장치를 사용할 수 있다. 또한 입력부(10)는 후보 리간드의 3차원 구조를 측정하는 장치를 포함할 수 있으며, 이들로부터 후보 리간드의 3차원 구조 데이터가 입력될 수 있다.The input unit 10 may use an input device such as a keyboard or a mouse. In addition, the input unit 10 may include a device for measuring the three-dimensional structure of the candidate ligand, from which the three-dimensional structure data of the candidate ligand can be input.

상기 연산부(20)는 입력부(10)로부터 입력된 데이터를 이용하여 후보 리간드의 작용제/길항제로서의 작용 가능성을 계산, 예측한다. 연산부(20)은 마이컴 또는 컴퓨터 등으로 구현될 수 있다. The calculation unit 20 calculates and predicts the possibility of acting as an agonist / antagonist of the candidate ligand by using the data input from the input unit 10. The calculating unit 20 may be implemented by a microcomputer or a computer.

본 발명의 한 구체예에서, 상기 연산부(20)는 입력부로 입력된 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하는 제1연산부(21); 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하는 제2연산부(22); 및 상기 진동수를 이용하여 후보 리간드의 작용을 예측하는 제3연산부(23)를 포함할 수 있다. In one embodiment of the present invention, the calculation unit 20 includes a first calculation unit 21 for geometrically optimizing the data input to the input unit to convert the structure of the candidate ligand into a structure of the minimum energy level state; A second calculation unit 22 for calculating a frequency of candidate ligand molecules of the converted minimum energy level state structure; And a third operation unit 23 for predicting the action of the candidate ligand using the frequency.

본 발명의 다른 구체예에서, 상기 제3연산부(23)는 후보 리간드의 분자 진동수를 일정한 간격으로 나누는 단계; 동일 간격 구간에 존재하는 분자 진동수의 강도를 합산하여 그 구간의 대표값으로 하는 단계; 및 상기 대표값의 패턴을 바탕으로 본 리간드와의 유사도를 비교하여 계통도를 구하는 단계를 포함하여 후보 리간드의 작용을 예측하는 것일 수 있다.In another embodiment of the present invention, the third operation unit 23 divides the molecular frequency of the candidate ligand at regular intervals; Summing the intensity of molecular frequencies present in the same interval section to form a representative value of the section; And comparing the similarity with the present ligand based on the pattern of the representative value to obtain a phylogenetic tree.

본 발명의 또 다른 구체예에서, 상기 리간드는 로돕신(rhodopsin) 유사 G-단백질-연결 수용체(G protein-coupled receptor, GPCR) 결합 리간드일 수 있으며, 보다 구체적으로 상기 로돕신(rhodopsin) 유사 G-단백질-연결 수용체(G protein-coupled receptor, GPCR)는 히스타민 수용체 또는 아데노신 수용체일 수 있으나 이에 제한되는 것은 아니다. In another embodiment of the present invention, the ligand may be a rdopsin-like G-protein-coupled receptor (GPCR) binding ligand, more specifically the rhodopsin-like G-protein G protein-coupled receptors (GPCRs) may be, but are not limited to, histamine receptors or adenosine receptors.

상기 출력부(30)는 연산부(20)에 의해 예측된 후보 리간드의 작용을 출력한다. 출력부(30)는 구체적으로 이에 제한되는 것은 아니나, 모니터, LCD 패널 등의 출력장치로 구현될 수 있다.
The output unit 30 outputs the action of the candidate ligand predicted by the calculating unit 20. The output unit 30 is not particularly limited thereto, but may be implemented as an output device such as a monitor or an LCD panel.

본 발명은 또한 상기 리간드의 분류 방법이 컴퓨터 상에서 수행될 수 있도록, 컴퓨터 프로그램으로 제작되어 이를 저장한 기록 매체로 구현될 수 있다. The present invention can also be embodied as a recording medium produced by a computer program and stored therein so that the ligand classification method can be performed on a computer.

즉, 본 발명에 따른 리간드 분류 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체에는,That is, the computer-readable medium in which the ligand classification program according to the present invention is recorded,

컴퓨터 입력장치를 통해 후보 리간드의 3차원 구조 데이터 정보를 입력받는 단계;Receiving 3D structural data information of the candidate ligand through a computer input device;

컴퓨터 연산장치가 상기 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하도록 하는 단계;Causing the computer computing device to geometrically optimize the data to convert the structure of the candidate ligand into a structure of a minimum energy level;

컴퓨터 연산장치가 상기 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하도록 하는 단계;Causing a computer computing device to calculate frequencies of candidate ligand molecules of the transformed minimum energy level state structure;

컴퓨터의 연산장치가 상기 진동수를 이용하여 후보 리간드의 작용을 예측하게 하는 단계; 및 Causing a computing device of the computer to predict the action of a candidate ligand using the frequency; And

컴퓨터의 출력장치가 상기 연산잔치에 의해 예측된 후보 리간드의 작용을 출력하게 하는 단계를 실행시키기 위한 리간드 분류 프로그램이 기록될 수 있다.
A ligand classification program can be recorded for executing the step of causing the output device of the computer to output the action of the candidate ligand predicted by the computation residual.

이하, 본 발명의 이해를 돕기 위하여 실시예를 들어 상세하게 설명하기로 한다. 다만 하기의 실시예는 본 발명의 내용을 예시하는 것일 뿐 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 본 발명의 실시예는 당업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해 제공되는 것이다.
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, the present invention will be described in detail with reference to the following examples. However, the following examples are intended to illustrate the contents of the present invention, but the scope of the present invention is not limited to the following examples. Embodiments of the present invention are provided to more fully describe the present invention to those skilled in the art.

<< 실시예Example 1> 히스타민 수용체 결합  1> histamine receptor binding 리간드의Ligand 분류  Classification

1. 데이터 세트1. Data set

데이터 세트의 SMILES 및 3차원 구조 데이터 포맷(SDF, structure data format) 파일은 NCBI (National Center for Biotechnology Information)의 PubChem Compound Database로부터 다운로드 받았고, 이후의 분석에 사용되었다. 데이터 세트의 모든 47 리간드 분자는 9 히스타민 작용제(agonist)와 38 히스타민 길항제(antagonist)를 포함하였으며, 이는 이하의 표 1과 같다. The SMILES and structure data format (SDF) files of the data set were downloaded from the PubChem Compound Database of the National Center for Biotechnology Information (NCBI) and used for later analysis. All 47 ligand molecules in the data set included 9 histamine agonists and 38 histamine antagonists, which are shown in Table 1 below.

PubChemPubChem IDID CompoundCompound namename ReceptorReceptor FunctionFunction typetype PubChemPubChem IDID CompoundCompound namename ReceptorReceptor FunctionFunction typetype 8765387653 2-thiazoleethanamine2-thiazoleethanamine HRH1HRH1 agonistagonist 39573957 loratadineloratadine HRH1HRH1 antagonistantagonist 23662366 betahistinebetahistine HRH1HRH1 agonistagonist 40344034 meclozinemeclozine HRH1HRH1 antagonistantagonist 7591975919 demethylbetahistinedemethylbetahistine HRH1HRH1 agonistagonist 47614761 pheniraminepheniramine HRH1HRH1 antagonistantagonist 77417741 betazolebetazole HRH2HRH2 agonistagonist 49274927 promethazinepromethazine HRH1HRH1 antagonistantagonist 30773077 dimapritdimaprit HRH2HRH2 agonistagonist 50025002 quetiapinequetiapine HRH1HRH1 antagonistantagonist 36923692 imetitimetit HRH3HRH3 agonistagonist 30329153032915 burimamideburimamide HRH2HRH2 antagonistantagonist 126688126688 amthamineamthamine HRH3,H4HRH3, H4 agonistagonist 27562756 cimetidinecimetidine HRH2HRH2 antagonistantagonist 4137641376 impromidineimpromidine HRH4HRH4 agonistagonist 52821365282136 lafutidinelafutidine HRH2HRH2 antagonistantagonist 52275227 SKF91488SKF91488 HRHR agonistagonist 30336373033637 nizatidinenizatidine HRH2HRH2 antagonistantagonist 22672267 azelastineazelastine HRH1HRH1 antagonistantagonist 52824505282450 pibutidinepibutidine HRH2HRH2 antagonistantagonist 26782678 cetirizinecetirizine HRH1HRH1 antagonistantagonist 30010553001055 ranitidineranitidine HRH2HRH2 antagonistantagonist 27252725 chlorpheniraminechlorpheniramine HRH1HRH1 antagonistantagonist 51055105 roxatidineroxatidine HRH2HRH2 antagonistantagonist 2698726987 clemastineclemastine HRH1HRH1 antagonistantagonist 5028750287 tiotidinetiotidine HRH2HRH2 antagonistantagonist 67266726 cyclizinecyclizine HRH1HRH1 antagonistantagonist 99540179954017 A-349821A-349821 HRH3HRH3 antagonistantagonist 124087124087 desloratadinedesloratadine HRH1HRH1 antagonistantagonist 98189039818903 ABT-239ABT-239 HRH3HRH3 antagonistantagonist 3303633036 dexchlorpheniraminedexchlorpheniramine HRH1HRH1 antagonistantagonist 23662366 betahistinebetahistine HRH3HRH3 antagonistantagonist 2185521855 dimetindenedimetindene HRH1HRH1 antagonistantagonist 64221246422124 ciproxifanciproxifan HRH3HRH3 antagonistantagonist 31003100 diphenhydraminediphenhydramine HRH1HRH1 antagonistantagonist 30357463035746 iodophenpropitiodophenpropit HRH3HRH3 antagonistantagonist 667477667477 doxepindoxepin HRH1HRH1 antagonistantagonist 99481029948102 pitolisantpitolisant HRH3HRH3 antagonistantagonist 31623162 doxylaminedoxylamine HRH1HRH1 antagonistantagonist 30359053035905 thioperamidethioperamide HRH3,H4HRH3, H4 antagonistantagonist 31913191 ebastineebastine HRH1HRH1 antagonistantagonist 27902790 clobenpropitclobenpropit HRH3HRH3 antagonistantagonist 1910519105 embramineembramine HRH1HRH1 antagonistantagonist 49083654908365 JNJ-7777120JNJ-7777120 HRH4HRH4 antagonistantagonist 33483348 fexofenadinefexofenadine HRH1HRH1 antagonistantagonist 1044629510446295 VUF6002VUF6002 HRH4HRH4 antagonistantagonist 15490001549000 levocetirizinelevocetirizine HRH1HRH1 antagonistantagonist

2. 기하학적 최적화(2. Geometric Optimization ( GeometryGeometry optimizationoptimization ) 및 분자 진동수 계산 ) And molecular frequency calculation

분자 진동수를 계산하기 위해, 화합물의 구조가 반드시 기하학적으로 최적화되어야 한다. 이론적 3차원 형상 SDF가 최소 에너지가 아니어서 진공, 용매, 또는 결합 주머니 내에서 가장 낮은 에너지를 갖는 형태를 대변하지 않으므로, 리간드 분자 각각의 SDF 파일은 GAMESS 프로그램 패키지를 사용하여 단일 저-에너지 형태로의 전환 과정을 거쳤다. 제한된 하트리-포크 계산법(Restricted Hartree-Fock calculations)이 6-31G 기초 세트와의 BLYP DFT 방법을 사용하여 분자를 기하학적으로 최적화시키기 위해 수행되었다. 분자 진동수의 계산은 분자 형태와 연관이 있음에도 불구하고, 각각의 결과는 분자의 형태를 대변하였다. 각각의 기하학적 최적화 결과는 GAMESS 프로그램의 HESSIAN 의 RUNTYP 으로 분자 진동수를 계산하는 단계에 사용되었다. 얻어진 분자 진동수의 일 예를 도 3에 나타내었다.
In order to calculate the molecular frequency, the structure of the compound must be geometrically optimized. Since the theoretical three-dimensional shape SDF is not the minimum energy and does not represent the lowest energy form in the vacuum, solvent, or bond pocket, each SDF file of the ligand molecules is in a single low-energy form using the GAMESS program package. Has gone through the transition process. Restricted Hartree-Fock calculations were performed to geometrically optimize the molecules using the BLYP DFT method with the 6-31G base set. Although the calculation of molecular frequencies is related to molecular morphology, each result represents a molecular morphology. Each geometric optimization result was used to calculate molecular frequencies with the HESSIAN RUNTYP of the GAMESS program. An example of the obtained molecular frequency is shown in FIG.

3. 분자 진동수의 군집 강도(3. Cluster strength of molecular frequency ( CorralledCorralled IntensityIntensity ofof Molecular  Molecular VibrationalVibrational FrequencyFrequency , , CIMVFCIMVF )의 )of 계보적Genealogical 군집화( Clustering HierarchicalHierarchical clusteringclustering ))

분자 비교를 간편화하기 위해, 계산된 분자 진동수는 오름차순으로 정렬되었고, 5 간격으로 나누어 군집화하였다. 각 간격 내의 각각의 진동수 강도를 합산하여 0 내지 5000 cm- 1 의 진동수 범위 에서 각 간격의 대표값으로 하였다. 최종 결과물을 위해, 상기 각각의 분자에 대한 잠재적 분자 지표는 1000 요소를 포함하는 1차원 벡터로 표시되었다. 마지막으로, 히스타민 리셉터의 47 리간드의 지표를 포함하는 유사도 매트릭스가 계층적으로 군집화되었다. 본 실시예에서, 유사도 매트릭스는 최종적으로 47 꼭지점을 가진 나무로 군집을 형성하였다. CIMVF 계산은 Python에 의해 작성된 in-house scripts에 의해 수행되었다. CIMVF를 통한 유사도 매트릭스의 계층적 군집화를 통해 나타낸 계통도를 도 4에 나타내었다. To simplify molecular comparisons, the calculated molecular frequencies were sorted in ascending order and divided by 5 intervals. By summing the each intensity in each frequency interval from 0 to 5000 cm -, at a frequency range of 1 it was the representative value for each interval. For the final result, the potential molecular indicators for each molecule were represented as one-dimensional vectors containing 1000 elements. Finally, a similarity matrix comprising indicators of the 47 ligands of the histamine receptor was hierarchically clustered. In this example, the similarity matrix finally clustered into trees with 47 vertices. CIMVF calculations were performed by in-house scripts written by Python. 4 is a schematic diagram through hierarchical clustering of the similarity matrix through CIMVF.

도 4에 나타낸 바에 따르면, impromidine 을 제외하고는 8개의 작용제가 히스타민 근처에 위치하였으며(점선 원으로 표시), 모든 길항제는 히스타민 근처의 방사상의 트리 에서 서로에 가깝게 군집화되었다. 따라서, 트리에서 작용제 및 저해제의 지역적 차이가 존재하며, 분자 진동수를 통해서 히스타민 수용체에 대한 작용제/저해제 분류에 대한 정보를 제공할 수 있다는 점을 알 수 있었다.
As shown in FIG. 4, eight agents except for impromidine were located near histamine (indicated by dashed circles) and all antagonists were clustered close to each other in the radial tree near histamine. Thus, it was found that there is a regional difference between agonists and inhibitors in the tree, and that molecular frequencies can provide information on the agonist / inhibitor classification for histamine receptors.

<< 비교예Comparative example 1> 히스타민 수용체  1> histamine receptor 리간드Ligand 구조 비교Structure comparison 를 통한 Through 리간드의Ligand 분류  Classification

히스타민 및 다른 46 화합물간의 분자 구조의 유사성이 화합물의 SMILES 로부터 분석되었다. 구조적 유사성이 계산되었으며, 이는 히스타민으로부터 각각의 분자의 Tanimoto distance로 표현되었다. 분자의 쌍별 비교(pairwise comparison)를 위한 Tanimoto 계수는 분자 구조 유사성의 측정에 가장 광범위하게 사용되는 측정값이고, Tc = N ab / (N a + N b - N ab) 로 규정되었다. 상기 식에서 N ab 는 분자인식기술(molecular fingerprint)을 사용한 공통 비트(common bit) 수, N a 는 분자 a의 고유 비트(unique bit)이고, N b 는 분자 b의 고유 비트(unique bit)이다. 본 실시예에서, 분자 유사성은 38-비트 세트를 사용한 Tanimoto 계수로 계산되었다.
Similarity of the molecular structure between histamine and other 46 compounds was analyzed from the SMILES of the compounds. Structural similarity was calculated, expressed as the Tanimoto distance of each molecule from histamine. Tanimoto coefficients for pairwise comparisons of molecules are the most widely used measure of molecular structure similarity, and Tc = N ab / ( N a + N b N ab ). Where N ab Is the number of common bits using molecular fingerprint, N a Is the unique bit of the molecule a, N b Is the unique bit of the molecule b. In this example, molecular similarity was calculated with Tanimoto coefficients using a 38-bit set.

히스타민 및 다른 리간드 분자들의 Tanimoto 계수를 아래 표 2에 나타내었다. Tanimoto coefficients of histamine and other ligand molecules are shown in Table 2 below.

CompoundCompound Tanimoto coefficientTanimoto coefficient Function typeFunction type CompoundCompound Tanimoto coefficientTanimoto coefficient Function typeFunction type histaminehistamine 1One agonistagonist imetitimetit 0.450.45 agonistagonist loratadineloratadine 0.130.13 antagonistantagonist burimamideburimamide 0.430.43 antagonistantagonist JNJ-7777120JNJ-7777120 0.130.13 antagonistantagonist thioperamidethioperamide 0.410.41 antagonistantagonist pitolisantpitolisant 0.120.12 antagonistantagonist iodophenpropitiodophenpropit 0.30.3 antagonistantagonist embramineembramine 0.120.12 antagonistantagonist demethylbetahistinedemethylbetahistine 0.30.3 agonistagonist cyclizinecyclizine 0.110.11 antagonistantagonist ciproxifanciproxifan 0.30.3 antagonistantagonist dimetindenedimetindene 0.110.11 antagonistantagonist impromidineimpromidine 0.290.29 agonistagonist meclozinemeclozine 0.110.11 antagonistantagonist clobenpropitclobenpropit 0.290.29 antagonistantagonist nizatidinenizatidine 0.10.1 antagonistantagonist betahistinebetahistine 0.270.27 antagonistantagonist promethazinepromethazine 0.10.1 antagonistantagonist amthamineamthamine 0.250.25 agonistagonist azelastineazelastine 0.10.1 antagonistantagonist 2-thiazoleethanamine2-thiazoleethanamine 0.250.25 agonistagonist cetirizinecetirizine 0.10.1 antagonistantagonist cimetidinecimetidine 0.240.24 antagonistantagonist levocetirizinelevocetirizine 0.10.1 antagonistantagonist betazolebetazole 0.220.22 agonistagonist tiotidinetiotidine 0.090.09 antagonistantagonist VUF6002VUF6002 0.190.19 antagonistantagonist ABT-239ABT-239 0.090.09 antagonistantagonist doxylaminedoxylamine 0.180.18 antagonistantagonist doxepindoxepin 0.090.09 antagonistantagonist pheniraminepheniramine 0.180.18 antagonistantagonist dimapritdimaprit 0.080.08 agonistagonist chlorpheniraminechlorpheniramine 0.180.18 antagonistantagonist A-349821A-349821 0.080.08 antagonistantagonist dexchlorpheniraminedexchlorpheniramine 0.180.18 antagonistantagonist pibutidinepibutidine 0.080.08 antagonistantagonist fexofenadinefexofenadine 0.160.16 antagonistantagonist SKF91488SKF91488 0.080.08 agonistagonist desloratadinedesloratadine 0.140.14 antagonistantagonist roxatidineroxatidine 0.080.08 antagonistantagonist diphenhydraminediphenhydramine 0.140.14 antagonistantagonist ranitidineranitidine 0.070.07 antagonistantagonist clemastineclemastine 0.130.13 antagonistantagonist lafutidinelafutidine 0.070.07 antagonistantagonist ebastineebastine 0.130.13 antagonistantagonist quetiapinequetiapine 0.070.07 antagonistantagonist

일반적으로 Tanimoto 계수가 > 0.85인 경우, 매우 높은 유사성이 있음을 의미하며, > 0.75인 경우 군집 분자와 유사한 목적을 갖는 유사한 생물학적 활성 특성을 갖는 물질임을 의미한다. 작용제(agonist) 중 가장 높은 Tanimoto 계수는 0.45 (imetit)로 나타났으며, 잠재적인 작용제로 볼 만큼 유사도가 높게 나타나지 못했다. 또한, 작용제(agonist) 중 가장 낮은 Tanimoto 계수 값은 0.08 (dimaprit 및 SKF91488)로 나타났으며, 저해제(antagonist)로서도 낮은 값을 보였다. In general, when the Tanimoto coefficient is> 0.85, it means that there is a very high similarity, and when> 0.75, it means that the material has similar biologically active properties with a similar purpose as the cluster molecule. The highest Tanimoto modulus among the agonists was 0.45 (imetit), with no similarity as potential agents. In addition, the lowest Tanimoto coefficient value among the agonists was 0.08 (dimaprit and SKF91488), and was also low as an antagonist.

따라서, Tanimoto 계수 및 분자의 기능간에 연관성이 미미하게 나타난 바, 리간드의 구조를 통해 리간드의 생물학적 활성을 예측하기는 어려운 것을 알 수 있었다.
Therefore, the relationship between the Tanimoto coefficient and the function of the molecule was found to be insignificant, and it was found that it is difficult to predict the biological activity of the ligand through the structure of the ligand.

<< 실시예Example 2> 아데노신 수용체 결합  2> adenosine receptor binding 리간드의Ligand 분류  Classification

아데노신 수용체 리간드 데이터 세트의 SMILES 및 3차원 구조 데이터 포맷(SDF, structure data format) 파일은 NCBI (National Center for Biotechnology Information)의 PubChem Compound Database로부터 다운로드 받았고, 이후의 분석에 사용되었다. 데이터 세트는 이하의 표 3과 같다. SMILES and three-dimensional structure data format (SDF) files of adenosine receptor ligand data sets were downloaded from the PubChem Compound Database of the National Center for Biotechnology Information (NCBI) and used for later analysis. The data sets are shown in Table 3 below.

PubChemPubChem IDID CompoundCompound namename ReceptorReceptor FunctionFunction typetype PubChemPubChem IDID CompoundCompound namename ReceptorReceptor FunctionFunction typetype 6096160961 adenosineadenosine AdoRAdoR agonistagonist 13291329 DPCPXDPCPX AdoRA1AdoRA1 antagonistantagonist 1047508210475082 2-MeCCPA2-MeCCPA AdoRA1AdoRA1 agonistagonist 64390916439091 FK453FK453 AdoRA1AdoRA1 antagonistantagonist 1621884516218845 ADACADAC AdoRA1AdoRA1 agonistagonist 98215119821511 FR194921FR194921 AdoRA1AdoRA1 antagonistantagonist 123807123807 CCPACCPA AdoRA1AdoRA1 agonistagonist 6462764627 KW-3902KW-3902 AdoRA1AdoRA1 antagonistantagonist 44024402 CPACPA AdoRA1AdoRA1 agonistagonist 99530659953065 SLV320SLV320 AdoRA1AdoRA1 antagonistantagonist 158795158795 CVT-510CVT-510 AdoRA1AdoRA1 agonistagonist 99020549902054 WRC-0571WRC-0571 AdoRA1AdoRA1 antagonistantagonist 1195754511957545 ENBAENBA AdoRA1AdoRA1 agonistagonist 26902690 CGS15943CGS15943 AdoRA2AAdoRA2A antagonistantagonist 130214130214 GR79236GR79236 AdoRA1AdoRA1 agonistagonist 66037616603761 CSCCSC AdoRA2AAdoRA2A antagonistantagonist 104795104795 NECANECA AdoRA1AdoRA1 agonistagonist 53110375311037 KW-6002KW-6002 AdoRA2AAdoRA2A antagonistantagonist 99360849936084 NNC21-0136NNC21-0136 AdoRA1AdoRA1 agonistagonist 1122314411223144 MSX-2MSX-2 AdoRA2AAdoRA2A antagonistantagonist 9320593205 R-PIA (L-PIA)R-PIA (L-PIA) AdoRA1AdoRA1 agonistagonist 1066806110668061 SCH442416SCH442416 AdoRA2AAdoRA2A antagonistantagonist 53114315311431 S-EBNAS-EBNA AdoRA1AdoRA1 agonistagonist 176408176408 SCH58261SCH58261 AdoRA2AAdoRA2A antagonistantagonist 164305164305 SDZWAG994SDZWAG994 AdoRA1AdoRA1 agonistagonist 21532153 theophylliinetheophylliine AdoRA2AAdoRA2A antagonistantagonist 30865993086599 CGS21680CGS21680 AdoRA2AAdoRA2A agonistagonist 99495419949541 VER-6947VER-6947 AdoRA2AAdoRA2A antagonistantagonist 98412849841284 CHACHA AdoRA2AAdoRA2A agonistagonist 99232699923269 VER-7835VER-7835 AdoRA2AAdoRA2A antagonistantagonist 15851585 CV1808CV1808 AdoRA2AAdoRA2A agonistagonist 56975697 XACXAC AdoRA2AAdoRA2A antagonistantagonist 219024219024 CVT-3146CVT-3146 AdoRA2AAdoRA2A agonistagonist 176407176407 ZM241385ZM241385 AdoRA2AAdoRA2A antagonistantagonist 164437164437 HENECAHENECA AdoRA2AAdoRA2A agonistagonist 53727205372720 alloxazinealloxazine AdoRA2BAdoRA2B antagonistantagonist 131432131432 SHA40SHA40 AdoRA2AAdoRA2A agonistagonist 18821882 compd19acompd19a AdoRA2BAdoRA2B antagonistantagonist 98335199833519 UK-432097UK-432097 AdoRA2AAdoRA2A agonistagonist 1019611410196114 CVT-5440CVT-5440 AdoRA2BAdoRA2B antagonistantagonist 95769129576912 WRC-0470(bino)WRC-0470 (bino) AdoRA2AAdoRA2A agonistagonist 16761676 enprofyllineenprofylline AdoRA2BAdoRA2B antagonistantagonist 89748974 2-CADO2-CADO AdoRA2BAdoRA2B agonistagonist 1171666511716665 LAS-38096LAS-38096 AdoRA2BAdoRA2B antagonistantagonist 1171783111717831 BAY60-6583BAY60-6583 AdoRA2BAdoRA2B agonistagonist CSID_19920712CSID_19920712 MRE2029-F20MRE2029-F20 AdoRA2BAdoRA2B antagonistantagonist 99750369975036 LUF5835LUF5835 AdoRA2BAdoRA2B agonistagonist 66039316603931 MRS1754MRS1754 AdoRA2BAdoRA2B antagonistantagonist 25192519 caffeinecaffeine AdoRAdoR antagonistantagonist 53110415311041 OSIP-339391OSIP-339391 AdoRA2BAdoRA2B antagonistantagonist 158540158540 BG9719BG9719 AdoRA1AdoRA1 antagonistantagonist 1168958311689583 PSB-36PSB-36 AdoRA2BAdoRA2B antagonistantagonist 216466216466 BG9928BG9928 AdoRA1AdoRA1 antagonistantagonist

이후, 상기 실시예 1의 2, 3단계를 동일하게 수행하였으며, 그 결과 얻어진 계통도를 도 5에 나타내었다. 도 5에 의하면, ZM241385를 제외하고 앞에 t로 표시된 길항제(antagonist)들은 모두 아데노신과 다른 군집을 형성하는 것을 알 수 있는 바, 본 발명의 방법을 통해 높은 확률로 길항제/작용제를 구별할 수 있음을 알 수 있었다.
Thereafter, steps 2 and 3 of Example 1 were performed in the same manner, and the resulting system diagram is shown in FIG. 5. According to Figure 5, except for ZM241385 it can be seen that the antagonists (tagonists) denoted by t all form a different group from adenosine, the method of the present invention can distinguish between antagonists / agents with a high probability. Could know.

이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시예일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
Having described the specific parts of the present invention in detail, it will be apparent to those skilled in the art that such specific descriptions are merely preferred embodiments, and thus the scope of the present invention is not limited thereto. will be. Accordingly, the actual scope of the present invention will be defined by the appended claims and their equivalents.

Claims (10)

후보 리간드의 3차원 구조 데이터 정보를 획득하는 단계;
상기 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하는 단계;
변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하는 단계; 및
상기 진동수를 이용하여 후보 리간드의 작용을 예측하는 단계를 포함하는 리간드 분류 방법.
Obtaining three-dimensional structural data information of the candidate ligand;
Geometrically optimizing the data to convert the structure of the candidate ligand into a structure with a minimum energy level;
Calculating the frequencies of candidate ligand molecules of the converted minimum energy level state structure; And
Predicting the action of a candidate ligand using the frequency.
제1항에 있어서,
상기 후보 리간드의 작용을 예측하는 단계는, 후보 리간드 및 본 리간드 분자의 진동수의 유사도를 비교하여 계통도를 구하는 것인 리간드 분류 방법.
The method of claim 1,
Predicting the action of the candidate ligand, Ligand classification method to obtain a phylogenetic tree by comparing the similarity of the frequency of the candidate ligand and the present ligand molecule.
제1항에 있어서,
상기 후보 리간드의 작용을 예측하는 단계는,
후보 리간드의 분자 진동수를 일정한 간격으로 나누는 단계; 동일 간격 구간에 존재하는 분자 진동수의 강도를 합산하여 그 구간의 대표값으로 하는 단계; 및 상기 대표값의 패턴을 바탕으로 본 리간드와의 유사도를 비교하여 계통도를 구하는 단계를 포함하는 것인 리간드 분류 방법.
The method of claim 1,
Predicting the action of the candidate ligand,
Dividing the molecular frequency of the candidate ligand by regular intervals; Summing the intensity of molecular frequencies present in the same interval section to form a representative value of the section; And comparing the similarity with the present ligand based on the pattern of the representative value to obtain a systematic diagram.
제1항 내지 제3항 중 어느 한 항에 있어서,
상기 리간드는 로돕신(rhodopsin) 유사 G-단백질-연결 수용체(G protein-coupled receptor, GPCR) 결합 리간드인 것인 리간드 분류 방법.
4. The method according to any one of claims 1 to 3,
Wherein said ligand is a rhodopsin-like G protein-coupled receptor (GPCR) binding ligand.
제4항에 있어서,
상기 로돕신(rhodopsin) 유사 G-단백질-연결 수용체(G protein-coupled receptor, GPCR)는 히스타민 수용체 또는 아데노신 수용체인 것인 리간드 분류 방법.
5. The method of claim 4,
And said rhodopsin-like G protein-coupled receptor (GPCR) is a histamine receptor or an adenosine receptor.
후보 리간드의 3차원 구조 데이터 정보를 입력받는 입력부;
상기 입력부로 입력된 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하는 제1연산부;
변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하는 제2연산부;
상기 진동수를 이용하여 후보 리간드의 작용을 예측하는 제3연산부; 및
상기 제3연산부를 통해 예측된 후보 리간드의 작용이 출력되는 출력부를 포함하는 리간드 분류 장치.
An input unit configured to receive 3D structural data information of a candidate ligand;
A first calculation unit which geometrically optimizes the data inputted to the input unit to convert the structure of the candidate ligand into a structure of a minimum energy level state;
A second operation unit for calculating a frequency of candidate ligand molecules of the converted minimum energy level state structure;
A third operation unit predicting the action of the candidate ligand using the frequency; And
Ligand classification apparatus comprising an output unit for outputting the action of the candidate ligand predicted through the third operation unit.
제6항에 있어서,
상기 제3연산부는 후보 리간드의 분자 진동수를 일정한 간격으로 나누는 단계; 동일 간격 구간에 존재하는 분자 진동수의 강도를 합산하여 그 구간의 대표값으로 하는 단계; 및 상기 대표값의 패턴을 바탕으로 본 리간드와의 유사도를 비교하여 계통도를 구하는 단계를 포함하여 후보 리간드의 작용을 예측하는 것인 리간드 분류 장치.
The method according to claim 6,
The third operation unit divides the molecular frequency of the candidate ligand at regular intervals; Summing the intensity of molecular frequencies present in the same interval section to form a representative value of the section; And comparing the similarity with the present ligand based on the pattern of the representative value to obtain a phylogenetic tree.
제6항 또는 제7항에 있어서,
상기 리간드는 로돕신(rhodopsin) 유사 G-단백질-연결 수용체(G protein-coupled receptor, GPCR) 결합 리간드인 것인 리간드 분류 장치.
8. The method according to claim 6 or 7,
Wherein said ligand is a rdopsin-like G protein-coupled receptor (GPCR) binding ligand.
제8항에 있어서,
상기 로돕신(rhodopsin) 유사 G-단백질-연결 수용체(G protein-coupled receptor, GPCR)는 히스타민 수용체 또는 아데노신 수용체인 것인 리간드 분류 장치.
9. The method of claim 8,
Wherein said rhodopsin-like G protein-coupled receptor (GPCR) is a histamine receptor or an adenosine receptor.
컴퓨터 입력장치를 통해 후보 리간드의 3차원 구조 데이터 정보를 입력받는 단계;
컴퓨터 연산장치가 상기 데이터를 기하학적으로 최적화하여 후보 리간드의 구조를 최소 에너지준위 상태의 구조로 변환하도록 하는 단계;
컴퓨터 연산장치가 상기 변환된 최소 에너지준위 상태 구조의 후보 리간드 분자의 진동수를 계산하도록 하는 단계;
컴퓨터의 연산장치가 상기 진동수를 이용하여 후보 리간드의 작용을 예측하게 하는 단계; 및
컴퓨터의 출력장치가 상기 연산잔치에 의해 예측된 후보 리간드의 작용을 출력하게 하는 단계를 실행시키기 위한 리간드 분류 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
Receiving 3D structural data information of the candidate ligand through a computer input device;
Causing the computer computing device to geometrically optimize the data to convert the structure of the candidate ligand into a structure of a minimum energy level;
Causing a computer computing device to calculate frequencies of candidate ligand molecules of the transformed minimum energy level state structure;
Causing a computing device of the computer to predict the action of a candidate ligand using the frequency; And
And a ligand classification program for executing a step of causing a computer output device to output the action of a candidate ligand predicted by the computation residual.
KR1020120062277A 2012-06-11 2012-06-11 Method and apparatus for classification of ligand by using molecular vibrational frequency patterns Expired - Fee Related KR101289948B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120062277A KR101289948B1 (en) 2012-06-11 2012-06-11 Method and apparatus for classification of ligand by using molecular vibrational frequency patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120062277A KR101289948B1 (en) 2012-06-11 2012-06-11 Method and apparatus for classification of ligand by using molecular vibrational frequency patterns

Publications (1)

Publication Number Publication Date
KR101289948B1 true KR101289948B1 (en) 2013-07-26

Family

ID=48998092

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120062277A Expired - Fee Related KR101289948B1 (en) 2012-06-11 2012-06-11 Method and apparatus for classification of ligand by using molecular vibrational frequency patterns

Country Status (1)

Country Link
KR (1) KR101289948B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101582843B1 (en) * 2014-08-05 2016-01-08 인제대학교 산학협력단 analyzing method and apparatus of ligand using molecular vibrational frequency
CN111538708A (en) * 2020-07-08 2020-08-14 武汉智慧地铁科技有限公司 Cleaning and compressing method for subway tunnel full-time global vibration monitoring historical data
WO2021200780A1 (en) * 2020-03-30 2021-10-07 味の素株式会社 Method for predicting presence or absence of aroma properties or olfactory receptor activation properties in substance

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05322817A (en) * 1991-11-19 1993-12-07 Houston Advanced Res Center Method and device for detecting molecule
JP2003083864A (en) 2001-09-14 2003-03-19 Initium:Kk Method for analyzing structural change of organism polymer
JP2004170364A (en) 2002-11-22 2004-06-17 Fujitsu Ltd Biopolymer identification method and device
JP2005242493A (en) 2004-02-24 2005-09-08 In-Silico Science Inc Protein cubic structure and ligand search method using induced fit

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05322817A (en) * 1991-11-19 1993-12-07 Houston Advanced Res Center Method and device for detecting molecule
JP2003083864A (en) 2001-09-14 2003-03-19 Initium:Kk Method for analyzing structural change of organism polymer
JP2004170364A (en) 2002-11-22 2004-06-17 Fujitsu Ltd Biopolymer identification method and device
JP2005242493A (en) 2004-02-24 2005-09-08 In-Silico Science Inc Protein cubic structure and ligand search method using induced fit

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101582843B1 (en) * 2014-08-05 2016-01-08 인제대학교 산학협력단 analyzing method and apparatus of ligand using molecular vibrational frequency
WO2021200780A1 (en) * 2020-03-30 2021-10-07 味の素株式会社 Method for predicting presence or absence of aroma properties or olfactory receptor activation properties in substance
JPWO2021200780A1 (en) * 2020-03-30 2021-10-07
CN111538708A (en) * 2020-07-08 2020-08-14 武汉智慧地铁科技有限公司 Cleaning and compressing method for subway tunnel full-time global vibration monitoring historical data

Similar Documents

Publication Publication Date Title
van Westen et al. Identifying novel adenosine receptor ligands by simultaneous proteochemometric modeling of rat and human bioactivity data
Brender et al. Predicting the effect of mutations on protein-protein binding interactions through structure-based interface profiles
Greenidge et al. MM/GBSA binding energy prediction on the PDBbind data set: successes, failures, and directions for further improvement
Pérez-Nueno et al. APIF: a new interaction fingerprint based on atom pairs and its application to virtual screening
Rueda et al. Recipes for the selection of experimental protein conformations for virtual screening
Muegge et al. Advances in virtual screening
Krier et al. Assessing the scaffold diversity of screening libraries
Zhang et al. In silico prediction of hERG potassium channel blockage by chemical category approaches
Mpamhanga et al. Knowledge-based interaction fingerprint scoring: a simple method for improving the effectiveness of fast scoring functions
Hu et al. Advancing the activity cliff concept
US20180172667A1 (en) Systems and methods for predicting cardiotoxicity of molecular parameters of a compound based on machine learning algorithms
Ekins et al. Insights for human ether-a-go-go-related gene potassium channel inhibition using recursive partitioning and Kohonen and Sammon mapping techniques
Baber et al. The use of consensus scoring in ligand-based virtual screening
Hu et al. Extending the activity cliff concept: structural categorization of activity cliffs and systematic identification of different types of cliffs in the ChEMBL database
Zhou et al. FINDSITEX: a structure-based, small molecule virtual screening approach with application to all identified human GPCRs
Mervin et al. Orthologue chemical space and its influence on target prediction
Qiu et al. The recent progress in proteochemometric modelling: focusing on target descriptors, cross-term descriptors and application scope
T Garcia-Sosa et al. Molecular property filters describing pharmacokinetics and drug binding
Wassermann et al. Chemical substitutions that introduce activity cliffs across different compound classes and biological targets
Saldívar-González et al. Getting SMARt in drug discovery: chemoinformatics approaches for mining structure–multiple activity relationships
Heifetz et al. Characterizing interhelical interactions of G-protein coupled receptors with the fragment molecular orbital method
KR101289948B1 (en) Method and apparatus for classification of ligand by using molecular vibrational frequency patterns
Thomas et al. Application of genomics to toxicology research.
Heng et al. A pan-specific GRU-based recurrent neural network for predicting HLA-I-binding peptides
Batista et al. Chemical database mining through entropy-based molecular similarity assessment of randomly generated structural fragment populations

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

PN2301 Change of applicant

St.27 status event code: A-3-3-R10-R11-asn-PN2301

St.27 status event code: A-3-3-R10-R13-asn-PN2301

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

Fee payment year number: 1

St.27 status event code: A-2-2-U10-U11-oth-PR1002

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

FPAY Annual fee payment

Payment date: 20160719

Year of fee payment: 4

PR1001 Payment of annual fee

Fee payment year number: 4

St.27 status event code: A-4-4-U10-U11-oth-PR1001

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

FPAY Annual fee payment

Payment date: 20170703

Year of fee payment: 5

PR1001 Payment of annual fee

Fee payment year number: 5

St.27 status event code: A-4-4-U10-U11-oth-PR1001

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PR1001 Payment of annual fee

Fee payment year number: 6

St.27 status event code: A-4-4-U10-U11-oth-PR1001

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R14-asn-PN2301

P14-X000 Amendment of ip right document requested

St.27 status event code: A-5-5-P10-P14-nap-X000

P16-X000 Ip right document amended

St.27 status event code: A-5-5-P10-P16-nap-X000

Q16-X000 A copy of ip right certificate issued

St.27 status event code: A-4-4-Q10-Q16-nap-X000

P15-X000 Request for amendment of ip right document rejected

St.27 status event code: A-5-5-P10-P15-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PC1903 Unpaid annual fee

Not in force date: 20190720

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

St.27 status event code: A-4-4-U10-U13-oth-PC1903

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PC1903 Unpaid annual fee

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20190720

St.27 status event code: N-4-6-H10-H13-oth-PC1903

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R11-asn-PN2301

St.27 status event code: A-5-5-R10-R13-asn-PN2301