UA79231C2 - Method for a discrete substructural analysis and a computer system for realizing the same - Google Patents
Method for a discrete substructural analysis and a computer system for realizing the same Download PDFInfo
- Publication number
- UA79231C2 UA79231C2 UA2003043420A UA2003043420A UA79231C2 UA 79231 C2 UA79231 C2 UA 79231C2 UA 2003043420 A UA2003043420 A UA 2003043420A UA 2003043420 A UA2003043420 A UA 2003043420A UA 79231 C2 UA79231 C2 UA 79231C2
- Authority
- UA
- Ukraine
- Prior art keywords
- chemical
- molecules
- compounds
- fragments
- fragment
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 239
- 238000004458 analytical method Methods 0.000 title claims abstract description 78
- 239000000126 substance Substances 0.000 claims abstract description 372
- 239000012634 fragment Substances 0.000 claims abstract description 258
- 230000008569 process Effects 0.000 claims abstract description 88
- 230000000144 pharmacologic effect Effects 0.000 claims abstract description 37
- 238000000137 annealing Methods 0.000 claims abstract description 20
- 150000001875 compounds Chemical class 0.000 claims description 308
- 230000000694 effects Effects 0.000 claims description 82
- 238000004364 calculation method Methods 0.000 claims description 27
- 150000001413 amino acids Chemical class 0.000 claims description 22
- 230000015572 biosynthetic process Effects 0.000 claims description 20
- 238000003041 virtual screening Methods 0.000 claims description 15
- 102000004169 proteins and genes Human genes 0.000 claims description 14
- 108090000623 proteins and genes Proteins 0.000 claims description 14
- 230000014509 gene expression Effects 0.000 claims description 9
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 229940126601 medicinal product Drugs 0.000 claims description 4
- 150000007523 nucleic acids Chemical group 0.000 claims 1
- 230000002363 herbicidal effect Effects 0.000 abstract description 4
- 230000000361 pesticidal effect Effects 0.000 abstract description 4
- 230000003197 catalytic effect Effects 0.000 abstract description 3
- 238000007876 drug discovery Methods 0.000 abstract description 2
- 239000003292 glue Substances 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 129
- 230000002401 inhibitory effect Effects 0.000 description 41
- 102000005962 receptors Human genes 0.000 description 41
- 108020003175 receptors Proteins 0.000 description 41
- 239000003112 inhibitor Substances 0.000 description 40
- 239000003446 ligand Substances 0.000 description 34
- 230000000875 corresponding effect Effects 0.000 description 31
- 238000012216 screening Methods 0.000 description 31
- 238000012360 testing method Methods 0.000 description 28
- 108091000080 Phosphotransferase Proteins 0.000 description 25
- 230000004071 biological effect Effects 0.000 description 25
- 102000020233 phosphotransferase Human genes 0.000 description 25
- 238000004422 calculation algorithm Methods 0.000 description 24
- 108090000765 processed proteins & peptides Proteins 0.000 description 21
- 230000027455 binding Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 17
- 229940024606 amino acid Drugs 0.000 description 16
- 235000001014 amino acid Nutrition 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 16
- 108091006146 Channels Proteins 0.000 description 15
- 238000011156 evaluation Methods 0.000 description 15
- 108091005804 Peptidases Proteins 0.000 description 14
- 239000004365 Protease Substances 0.000 description 14
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 14
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 13
- 235000018102 proteins Nutrition 0.000 description 13
- 238000011160 research Methods 0.000 description 13
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 11
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 230000002110 toxicologic effect Effects 0.000 description 11
- 238000013459 approach Methods 0.000 description 10
- -1 but not limited to Chemical class 0.000 description 10
- 239000003153 chemical reaction reagent Substances 0.000 description 10
- 102000004310 Ion Channels Human genes 0.000 description 9
- 108090000862 Ion Channels Proteins 0.000 description 9
- 102000001253 Protein Kinase Human genes 0.000 description 9
- 238000009826 distribution Methods 0.000 description 9
- 239000003596 drug target Substances 0.000 description 9
- 238000013537 high throughput screening Methods 0.000 description 9
- 108060006633 protein kinase Proteins 0.000 description 9
- 108010052164 Sodium Channels Proteins 0.000 description 8
- 102000018674 Sodium Channels Human genes 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 229940126062 Compound A Drugs 0.000 description 7
- NLDMNSXOCDLTTB-UHFFFAOYSA-N Heterophylliin A Natural products O1C2COC(=O)C3=CC(O)=C(O)C(O)=C3C3=C(O)C(O)=C(O)C=C3C(=O)OC2C(OC(=O)C=2C=C(O)C(O)=C(O)C=2)C(O)C1OC(=O)C1=CC(O)=C(O)C(O)=C1 NLDMNSXOCDLTTB-UHFFFAOYSA-N 0.000 description 7
- 230000009471 action Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 229960003638 dopamine Drugs 0.000 description 7
- 230000005764 inhibitory process Effects 0.000 description 7
- 229940043355 kinase inhibitor Drugs 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000002907 substructure search Methods 0.000 description 7
- 230000002588 toxic effect Effects 0.000 description 7
- 231100000027 toxicology Toxicity 0.000 description 7
- 108010016626 Dipeptides Proteins 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- JNGZXGGOCLZBFB-IVCQMTBJSA-N compound E Chemical compound N([C@@H](C)C(=O)N[C@@H]1C(N(C)C2=CC=CC=C2C(C=2C=CC=CC=2)=N1)=O)C(=O)CC1=CC(F)=CC(F)=C1 JNGZXGGOCLZBFB-IVCQMTBJSA-N 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 239000002213 purine nucleotide Substances 0.000 description 6
- 150000003212 purines Chemical class 0.000 description 6
- 229940044601 receptor agonist Drugs 0.000 description 6
- 239000000018 receptor agonist Substances 0.000 description 6
- 229960004441 tyrosine Drugs 0.000 description 6
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 6
- 238000003556 assay Methods 0.000 description 5
- 150000007514 bases Chemical class 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 239000007795 chemical reaction product Substances 0.000 description 5
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000001747 exhibiting effect Effects 0.000 description 5
- 239000002547 new drug Substances 0.000 description 5
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 231100000331 toxic Toxicity 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- MMWCIQZXVOZEGG-HOZKJCLWSA-N [(1S,2R,3S,4S,5R,6S)-2,3,5-trihydroxy-4,6-diphosphonooxycyclohexyl] dihydrogen phosphate Chemical compound O[C@H]1[C@@H](O)[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](O)[C@H]1OP(O)(O)=O MMWCIQZXVOZEGG-HOZKJCLWSA-N 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 230000030609 dephosphorylation Effects 0.000 description 4
- 238000007824 enzymatic assay Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 108010085082 sigma receptors Proteins 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 229940102550 Estrogen receptor antagonist Drugs 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- 108090000137 Opioid Receptors Proteins 0.000 description 3
- 102000003840 Opioid Receptors Human genes 0.000 description 3
- 102000016978 Orphan receptors Human genes 0.000 description 3
- 108070000031 Orphan receptors Proteins 0.000 description 3
- 101150059448 cdk7 gene Proteins 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000000546 chi-square test Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000006209 dephosphorylation reaction Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000003136 dopamine receptor stimulating agent Substances 0.000 description 3
- 239000002532 enzyme inhibitor Substances 0.000 description 3
- 102000015694 estrogen receptors Human genes 0.000 description 3
- 108010038795 estrogen receptors Proteins 0.000 description 3
- 239000004009 herbicide Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 230000004054 inflammatory process Effects 0.000 description 3
- 238000012804 iterative process Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 239000000575 pesticide Substances 0.000 description 3
- 230000003389 potentiating effect Effects 0.000 description 3
- 230000004850 protein–protein interaction Effects 0.000 description 3
- 102000028828 purine nucleotide binding proteins Human genes 0.000 description 3
- 108091009376 purine nucleotide binding proteins Proteins 0.000 description 3
- 230000002285 radioactive effect Effects 0.000 description 3
- 229940044551 receptor antagonist Drugs 0.000 description 3
- 239000002464 receptor antagonist Substances 0.000 description 3
- 230000007958 sleep Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000012916 structural analysis Methods 0.000 description 3
- 239000003440 toxic substance Substances 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 108090000543 Ligand-Gated Ion Channels Proteins 0.000 description 2
- 102000004086 Ligand-Gated Ion Channels Human genes 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 238000001358 Pearson's chi-squared test Methods 0.000 description 2
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 2
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 2
- 238000004617 QSAR study Methods 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical group [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 230000008484 agonism Effects 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 150000003862 amino acid derivatives Chemical class 0.000 description 2
- 230000008485 antagonism Effects 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 229910052729 chemical element Inorganic materials 0.000 description 2
- 231100000481 chemical toxicant Toxicity 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 238000009509 drug development Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229960000367 inositol Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 229940126181 ion channel inhibitor Drugs 0.000 description 2
- 238000000021 kinase assay Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 210000004126 nerve fiber Anatomy 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229960005190 phenylalanine Drugs 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000009822 protein phosphorylation Effects 0.000 description 2
- 230000005588 protonation Effects 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 2
- 239000003982 sigma receptor ligand Substances 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 231100000563 toxic property Toxicity 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- YFGBQHOOROIVKG-BHDDXSALSA-N (2R)-2-[[(2R)-2-[[2-[[2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylsulfanylbutanoic acid Chemical compound C([C@H](C(=O)N[C@H](CCSC)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 YFGBQHOOROIVKG-BHDDXSALSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- MPDDTAJMJCESGV-CTUHWIOQSA-M (3r,5r)-7-[2-(4-fluorophenyl)-5-[methyl-[(1r)-1-phenylethyl]carbamoyl]-4-propan-2-ylpyrazol-3-yl]-3,5-dihydroxyheptanoate Chemical compound C1([C@@H](C)N(C)C(=O)C2=NN(C(CC[C@@H](O)C[C@@H](O)CC([O-])=O)=C2C(C)C)C=2C=CC(F)=CC=2)=CC=CC=C1 MPDDTAJMJCESGV-CTUHWIOQSA-M 0.000 description 1
- IQUPABOKLQSFBK-UHFFFAOYSA-N 2-nitrophenol Chemical compound OC1=CC=CC=C1[N+]([O-])=O IQUPABOKLQSFBK-UHFFFAOYSA-N 0.000 description 1
- MYLBTCQBKAKUTJ-UHFFFAOYSA-N 7-methyl-6,8-bis(methylsulfanyl)pyrrolo[1,2-a]pyrazine Chemical compound C1=CN=CC2=C(SC)C(C)=C(SC)N21 MYLBTCQBKAKUTJ-UHFFFAOYSA-N 0.000 description 1
- 238000010953 Ames test Methods 0.000 description 1
- 231100000039 Ames test Toxicity 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 229940098778 Dopamine receptor agonist Drugs 0.000 description 1
- 102400000242 Dynorphin A(1-17) Human genes 0.000 description 1
- 108010065372 Dynorphins Proteins 0.000 description 1
- 208000017701 Endocrine disease Diseases 0.000 description 1
- 238000000729 Fisher's exact test Methods 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 102400000243 Leu-enkephalin Human genes 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010022337 Leucine Enkephalin Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100032587 MOB-like protein phocein Human genes 0.000 description 1
- 101710168500 MOB-like protein phocein Proteins 0.000 description 1
- 101150104182 MOB2 gene Proteins 0.000 description 1
- 102400000988 Met-enkephalin Human genes 0.000 description 1
- 108010042237 Methionine Enkephalin Proteins 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 102000016979 Other receptors Human genes 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101100018694 Rattus norvegicus Il24 gene Proteins 0.000 description 1
- 229940124639 Selective inhibitor Drugs 0.000 description 1
- 206010070834 Sensitisation Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010085012 Steroid Receptors Proteins 0.000 description 1
- JXASPPWQHFOWPL-UHFFFAOYSA-N Tamarixin Natural products C1=C(O)C(OC)=CC=C1C1=C(OC2C(C(O)C(O)C(CO)O2)O)C(=O)C2=C(O)C=C(O)C=C2O1 JXASPPWQHFOWPL-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 231100000777 Toxicophore Toxicity 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 229960003121 arginine Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000010876 biochemical test Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 239000007806 chemical reaction intermediate Substances 0.000 description 1
- 238000013098 chemical test method Methods 0.000 description 1
- 238000002983 circular dichroism Methods 0.000 description 1
- 230000009137 competitive binding Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 229960002433 cysteine Drugs 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- JMNJYGMAUMANNW-FIXZTSJVSA-N dynorphin a Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 JMNJYGMAUMANNW-FIXZTSJVSA-N 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000006274 endogenous ligand Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000328 estrogen antagonist Substances 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 229960002743 glutamine Drugs 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000001183 hydrocarbyl group Chemical group 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 102000003898 interleukin-24 Human genes 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 230000008863 intramolecular interaction Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 208000037906 ischaemic injury Diseases 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- URLZCHNOLZSCCA-UHFFFAOYSA-N leu-enkephalin Chemical compound C=1C=C(O)C=CC=1CC(N)C(=O)NCC(=O)NCC(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 URLZCHNOLZSCCA-UHFFFAOYSA-N 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 229960003646 lysine Drugs 0.000 description 1
- FDZZZRQASAIRJF-UHFFFAOYSA-M malachite green Chemical compound [Cl-].C1=CC(N(C)C)=CC=C1C(C=1C=CC=CC=1)=C1C=CC(=[N+](C)C)C=C1 FDZZZRQASAIRJF-UHFFFAOYSA-M 0.000 description 1
- 229940107698 malachite green Drugs 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 235000006109 methionine Nutrition 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000007886 mutagenicity Effects 0.000 description 1
- 231100000299 mutagenicity Toxicity 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000005445 natural material Substances 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000019581 neuron apoptotic process Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 102000026415 nucleotide binding proteins Human genes 0.000 description 1
- 108091014756 nucleotide binding proteins Proteins 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 230000002263 peptidergic effect Effects 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 239000000419 plant extract Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 229940121649 protein inhibitor Drugs 0.000 description 1
- 239000012268 protein inhibitor Substances 0.000 description 1
- LVTJOONKWUXEFR-FZRMHRINSA-N protoneodioscin Natural products O(C[C@@H](CC[C@]1(O)[C@H](C)[C@@H]2[C@]3(C)[C@H]([C@H]4[C@@H]([C@]5(C)C(=CC4)C[C@@H](O[C@@H]4[C@H](O[C@H]6[C@@H](O)[C@@H](O)[C@@H](O)[C@H](C)O6)[C@@H](O)[C@H](O[C@H]6[C@@H](O)[C@@H](O)[C@@H](O)[C@H](C)O6)[C@H](CO)O4)CC5)CC3)C[C@@H]2O1)C)[C@H]1[C@H](O)[C@H](O)[C@H](O)[C@@H](CO)O1 LVTJOONKWUXEFR-FZRMHRINSA-N 0.000 description 1
- 239000012429 reaction media Substances 0.000 description 1
- 108091006082 receptor inhibitors Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 238000003375 selectivity assay Methods 0.000 description 1
- 230000008313 sensitization Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229910001415 sodium ion Inorganic materials 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 231100000820 toxicity test Toxicity 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Computing Systems (AREA)
- Pharmacology & Pharmacy (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
Опис винаходу
Цей винахід стосується комп'ютерної системи, здатної виконувати дискретний структурно-фрагментарний 2 аналіз, і способу її використання. Цей аналіз дозволяє виконувати за допомогою комп'ютера ідентифікацію молекул, що мають певні задані властивості, такі як біологічна і/або хімічна активність. Цей комп'ютерний дискретний структурно-фрагментарний аналіз може використовуватися для створення нових ліків або в інших галузях, де може представляти інтерес ідентифікація речовин, активних у біологічному, фармакологічному, токсикологічному, пестицидному, гербіцидному, каталітичному відношенні тощо. 70 Від ідентифікації біологічно активних молекул залежить, наприклад, прогрес в галузі медичної хімії. У багатьох випадках науково-дослідні програми націлені на синтез невеликих органічних молекул, здатних взаємодіяти з відомим ферментом або рецептором-мішенню з метою досягнення бажаного фармакологічного ефекту. Такі сполуки можуть, принаймні частково, імітувати або інгібувати активність відомої речовини, що зустрічається в природі, але призначаються для виявлення більш сильної і/або більш селективної дії. 12 Сполуки, що з'являються внаслідок досліджень такого роду, можуть мати певні структурні ознаки відповідних речовин, що зустрічаються в природі.
Науково-дослідні програми можуть також базуватися на сполуках, що зустрічаються в природі, виявлених внаслідок скринінгу природних речовин, наприклад, проб грунту або рослинних витяжок. Виявлені таким чином активні сполуки можуть виявитися корисними базовими сполуками при використанні технологій синтетичної хімії.
У останні роки зросла необхідність ідентифікації нових і корисних біологічно активних речовин, їі, як наслідок, були розроблені нові способи створення базових сполук. У цьому відношенні особливо важливі два напрями, а саме комбінаторна хімія і високопродуктивний скринінг (підп (пгоцдприї зсгеепіпа - НТ).
У комбінаторній хімії використовуються роботизовані або ручні методи здійснення численних дрібномасштабних хімічних реакцій, в кожній з яких використовується різна комбінація реагентів, одночасно або с "паралельно", внаслідок чого створюється велика кількість різних хімічних об'єктів для скринінгу. Сукупність Ге) отриманих таким способом сполук відома як "бібліотека". Бібліотеки для створення нових хімічних базових структур звичайно максимально різноманітні. Однак за певних обставин, за допомогою підбору реактивів, призначених для введення специфічних структурних ознак в кінцеві сполуки, при формуванні бібліотек можуть робити умисний ухил в певний бік, орієнтуватися на конкретну фармакологічну мету або зосереджуватися на -- конкретній галузі хімії. со
Високопродуктивний скринінг передбачає використання біохімічних проб для швидкої перевірки активності іп міо великої кількості хімічних сполук на одній або кількох біологічних мішенях. Цей метод є ідеальним для с скринінгу великих бібліотек сполук, створених комбінаторною хімією. Ге»!
Незважаючи на безперечні переваги комбінаторної хімії Її високопродуктивного скринінгу в створенні нових
Зо базових структур, у цих методів є певні недоліки. Значна частка сполук в несистематичних бібліотеках не має - корисної активності. Тому виявлення корисних базових сполук залежить від випадку і/або кількості перевірених сполук. У цілеспрямованих" бібліотеках частка активних сполук може бути більш високою, але такі бібліотеки залежать від критеріїв вибору і можуть навіть не включати оптимальних сполук. Більш того, для обох методів « необхідні значні ресурси і експериментальна база. З 50 Імовірність виявлення активної молекули в певній заданій множині сполук можна підвищити або шляхом с збільшення загальної кількості сполук, що перевіряються (тобто розміру цих множин), або шляхом збільшення з» частки активних сполук в даній множині. Можна показати, що для підвищення імовірності виявлення активної молекули збільшення частки активних сполук в певній множині сполук є ефективнішим, ніж просте збільшення загальної кількості сполук, що перевіряються. Перший підхід зменшує кількість сполук, які необхідно одержати | перевірити, і тому він також більш вигідний в сенсі витрати ресурсів, необхідних, наприклад, для виявлення 7 біологічно активних молекул. (се) Структурно-фрагментарний аналіз (відомий як зибрзіисійга! апаїузів) як підхід до проблеми розробки лікарських засобів розкритий |в публікації Кіснага ОО. Сгатег Ш. ей аїЇ.,, У. Мей. Спет., 17 (1974), ді сс.553-535|. У ній описано, що біологічну активність молекули, як і будь-яку іншу її властивість, треба оз 20 пояснювати поєднанням внесків її структурних компонентів (підструктур) і їхніми внутрішньомолекулярними і міжмолекулярними взаємодіями. Внесок певної заданої підструктури в імовірність активності може бути та отриманий з даних вже перевірених сполук, що мають цю підструктуру. Перший етап полягає в приготуванні "таблиці досвіду" підструктур, що узагальнює наявні дані. "Частота активності підструктури" (ЗАБ) визначається для кожної підструктури як відношення кількості активних сполук, що містять цю підструктуру, до 29 кількості перевірених сполук, що містять цю підструктуру. Вважається, що 5АР відображає внесок, який дана під
ГФ) структура може внести в імовірність активності відповідної сполуки. Потім для кожної сполуки обчислюється середнє арифметичне значень ЗАЕ підструктур, наявних в даній сполуці. о Хоч ця відома методика дозволяє ранжувати сполуки за їхніми середніми значеннями 5АКЕ, отримання такого значення вимагає обчислення середнього арифметичного значень ЗАЕ кожної підструктури сполуки. Більш того, 60 самі значення 5АЕ, необхідні для цих розрахунків, є результатом попереднього обчислення, яке передбачає оцінку кожної підструктур в кожній із молекул, що перевіряються. Тому цей підхід веде до значних обчислювальних витрат, що стримує застосування цієї методики до наявних на сьогодні великих наборів даних, які можна було б використати як джерело інформації для проведення структурного аналізу молекул. До цього ж, цей запропонований Крамером метод фактично не дозволяє оцінити дійсний внесок, який вносить підструктура в 62 активність.
Відповідно, в галузі хімічного структурного аналізу існує ряд інших відомих методів.
У |документі ЕР 938055) розкрито спосіб визначення кількісних залежностей структура-активність" на основі отриманих високопродуктивним скринінгом даних, шляхом виявлення структурних ознак, які роблять" сполуки "активними". Цей спосіб передбачає створення статистичної моделі біологічно активних сполук, яка спочатку прив'язує різні хімічні дескриптори до певної заданої множини сполук, а потім, використовуючи певну підмножину сполук із відомою біологічною активністю, навчає цю модель прогнозувати, чи буде нова сполука біологічно активною, чи ні.
ІЗПегідап і Кеагвіеу, 9. СПпет. Іп7ї Сотриї Зсі., З5 (1995), сс.310-320), описують використання 7/0 Генетичних алгоритмів для вибору підмножини фрагментів із метою використання в побудові комбінаторної бібліотеки. Цей спосіб передбачає формування групи молекул з підмножини фрагментів молекул і обчислення рейтингу" кожної молекули на основі заданих дескрипторів (наприклад, атомної пари або топологічного обертання), використовуючи або пробу на подібність, або методи векторів трендів. За допомогою генетичного алгоритму формують додаткові групи і оцінюють відповідні рейтинги. У результаті одержують перелік 7/5 фрагментів, що зустрічаються у молекулах з максимальном рейтингом і можуть бути використані як основа для побудови комбінаторної бібліотеки.
ГУ УМО 99/26901А1)| розкривається спосіб конструювання хімічних речовин, таких як молекули. Сполука складається з каркаса і ряду місць зв'язування. Здійснення способу починається з вибору елементів-кандидатів для цих місць зв'язування і створення масиву прогнозування (відомого як ргедісіїме дезідпейа агау, РАЮ).
Наприклад, РАО включає певну кількість віртуальних сполук, що задовольняють певним умовам комбінування. Ці сполуки потім синтезують і випробовують на наявність біологічної активності. Потім виконується алгоритм для прогнозування загальної біологічної активності сполук, які не були синтезовані. Для цього обчислюють значення внесків у властивість елементів-кандидатів, що представляють відповідний внесок кожного з окремих елементів у зумовлення даної активності. Потім обчислюють середній внесок в біологічну активність кожної сч об Групи-замісника в певному заданому місці зв'язування. У цьому документі наводиться приклад того, як обчислюють такий внесок. і)
ЇУ статті Н. Оао еї аї, 9). Спет. Іпї. Сотриї. Зсі. (39) 1999, сс.164-168)| описується застосування для виявлення нових лікарських засобів методу визначення кількісних залежностей структура-активність" (відомого як ацапійайме вігисійге-асіїмну геїайопепір, ОБЗАК). Після вибору біологічно активних сполук оптимізують «- зр їхню біологічну активність. Оскільки метод О5АК базується на наявності гіпотетичного зв'язку між біологічною активністю і молекулярною структурою, він використовується для ідентифікації структурних ознак, що роблять ме) сполуки активними, і прогнозування активних і неактивних аналогів. с
ЇУ документі МУО 00/41060| розкривається спосіб кореляції активності речовин з їхніми структурними ознаками. Термін "структурна ознака" стосується атомів і зв'язків структури, яка відповідає певному Ме зв еталонному шаблону. На першому етапі визначають речовини певної множини речовин, що задовольняють ї- даній структурній ознаці Її обмеженням щодо властивостей. Потім для кожної категорії активності визначають речовини, що попадають в цю категорію. Після розподілу цієї множини речовин по декількох категоріях активності обчислюють очікувану активність для кожної підмножини, а для кожної структурної особливості будують вектори "активність-властивість-ознака", які вказують кількості речовин, що мають згадану ознаку і «
Входять в згадану категорію активності. Цей документ стосується біологічної активності, а також стосується з с виявлення нових ліків.
ГУ 05 6,185,506 ВІ) розкривається спосіб вибору оптимально різноманітної бібліотеки невеликих молекул, ;» виходячи з достовірних дескрипторів молекулярної структури. Використовується множина наборів даних зі спеціальної літератури з найрізноманітніших хімічних структур і активностей, які відповідають цим структурам.
Активність може бути біологічною і хімічною. Цей спосіб описується в контексті фармацевтичних лікарських -І засобів. Крім того, розкривається спосіб вибору підмножини молекул-продуктів для всіх можливих молекул-продуктів, які можна було б створити шляхом комбінаторного синтезу з молекул-реагентів і спільних і, центральних молекул. У розділі, що описує попередній рівень техніки, є посилання на біологічно-орієнтовані ко бібліотеки, побудовані на основі знань геометричного розташування структурних фрагментів, виділених із молекулярних структур, про наявність активності у яких відомо. В цьому документі сказано, що абсолютно о необхідним є використовувати раціонально побудовані, але менших розмірів, бібліотеки для скринінгу, що як зберігають, проте, різноманітність комбінаційно-можливих сполук.
ГУ УХО 00/49539 АТ| розкривається спосіб скринінгу певної множини молекул для ідентифікації множин ознак молекул, для яких існує імовірність кореляції з певною заданою активністю. Термін "ознака" стосується дв Хімічних підструктур. Збирають певну множину молекул відповідно до їхньої молекулярної структури, що характеризується певною множиною дескрипторів. Потім виявляють групи, що представляють високий рівень
Ф) активності, і знаходять серед цих молекул в цих групах підструктури, які зустрічаються найчастіше. Буде ка логічним скорелювати ці фрагменти з рівнем активності, що спостерігається. Потім визначають набір даних, що представляє ті молекули з первинного набору даних, які містять згадану підмножину ознак, що часто бо Зустрічаються. Цей спосіб розкривається в формі комп'ютерної системи для автоматичного аналізу набору даних.
ГУ 5 5,463,564| розкривається спосіб автоматичного створення сполук за допомогою комп'ютера шляхом роботизованого синтезу і аналізу множини хімічних сполук. Спосіб виконується ітеративно і спрямований на отримання хімічних об'єктів із заданою активністю. Утворюється хімічна бібліотека з різноманітністю певного б5 спрямування, що містить певну множину хімічних речовин. Роботизованим аналізом хімічних сполук виявляють зв'язки між структурою і активністю. Розкривається використання декількох баз даних, кожна з яких має поле,
що вказує рейтинговий коефіцієнт, призначений відповідній сполуці. Цей рейтинговий коефіцієнт призначається кожній сполуці виходячи з того, наскільки близько активність даної сполуки відповідає бажаній активності.
Вищезазначені способи або є прогнозуючими моделями, або все ж не дають змоги в достатній мірі поліпшити процес створення активних базових сполук і підвищити імовірність виявлення активних сполук в заданій множині сполук. Крім того, відомі методи неспроможні задовольнити потребу в збільшенні кількості і якості молекулярних "підказок" і базових сполук, необхідних розробникам.
Відповідно, мета цього винаходу полягає в тому, щоб надати спосіб використання комп'ютерної системи і відповідну комп'ютерну систему, здатні підвищити імовірність виявлення нових біологічно і/або хімічно /о активних молекул.
Ця мета досягається цим винаходом, як він охарактеризований в незалежних пунктах формули винаходу.
Варіанти здійснення, яким віддається перевага, визначені в залежних пунктах формули винаходу.
Однією з переваг цього винаходу є те, що надається комп'ютерна система або метод її використання, які дають змогу збільшити частку активних сполук в певній заданій множині хімічних об'єктів, щодо яких не відомо, /5 Чи мають вони бажану активність. Це досягається шляхом застосування методів, в основі яких є використання баз знань, для ідентифікації груп-"підказок" і груп-"ключів", особливо шляхом побудови систем для виявлення молекул шляхом застосуванням обчислень.
Ще одна перевага цього винаходу полягає в тому, що за допомогою аналізу бази даних, що дозволяє проведення пошуку за молекулярними структурами і біологічними і/або хімічними властивостями, вдається 2о уникнути експериментів, що дорого коштують. Тому процес виявлення молекул, запропонований згідно з цим винаходом, може бути раціоналізований, що, в свою чергу, призведе до здешевлення процесу виявлення нових лікарських засобів.
Крім того, цей винахід вигідно відрізняється тим, що дозволяє прискорити процеси виявлення, так що молекули, що мають задані бажані властивості, можна ідентифікувати швидше, ніж це можна зробити при сч застосуванні відомих способів.
Крім того, цей винахід є дуже корисним в галузі біохімії. Здійснені в минулому розшифровка послідовності і)
ДНК, ї, особливо, секвенування генома, призвели до створення великих баз даних з послідовностями амінокислот, які можна використати як відправну точку при здійсненні цього винаходу. Крім того, цей винахід дає змогу ідентифікувати "відомі Мабо сирітські ліганди мМабо пари сирітський ліганд-рецептор шляхом «- зо прогнозування послідовності пептидів на основі результатів, отриманих за списком структур, проаналізованих на біологічно активні хімічні детермінанти. Після ідентифікації в базі даних і за експресією, послідовності і) пептидів можуть бути перевірені біохімічною пробою. Відповідно, цей винахід надає переваги в тому, що він дає с змогу виводити біологічні структури шляхом зіставлення зі списком хімічних молекул із вже визначеною на певній мішені активністю, і тим самим надає спосіб ідентифікації (зворотного секвенування). Ме
Винахід буде описаний докладніше з посиланням на графічні фігури, на яких: М
Фіг.1 - блок-схема, що ілюструє комп'ютерну систему, запропоновану згідно з одним із варіантів здійснення цього винаходу, яким віддається перевага;
Фіг.2 - блок-схема, що ілюструє основний процес виконання дискретного структурного аналізу відповідно до одного з варіантів здійснення цього винаходу, яким віддається перевага; «
Фіг.3 - схематичне зображення, що ілюструє процес повторної ітерації згідно з цим винаходом; з с Фіг.4 - блок-схема, що ілюструє процес формування бібліотеки фрагментів відповідно до одного з варіантів . здійснення цього винаходу, яким віддається перевага; а Фіг.5 - графік, що показує, як можна вибирати фрагменти на основі обчислених значень внесків (рейтингових значень);
Фіг.6 - блок-схема, що ілюструє процес обчислення значення внеску фрагмента відповідно до одного з -І варіантів здійснення цього винаходу, яким віддається перевага;
Фіг.7 - блок-схема, що ілюструє процес аналізу згаданої бібліотеки фрагментів при виконанні повторної і, ітерації; ко Фіг.8 - блок-схема, що ілюструє процес вибору нової сполуки шляхом використання узагальнених подструктур; о Фіг.9 - блок-схема, що ілюструє процес отримання підструктур для використання у віртуальному скринінгу; як Фіг.10 - блок-схема, що ілюструє процес аналізу згаданої бібліотеки фрагментів при виконанні повторної ітерації із застосуванням методу відпалу відповідно до одного з варіантів здійснення цього винаходу, яким віддається перевага;
Фіг.11 - приклад карти відносних внесків для ілюстрації методу відпалу, застосованого в процесі з Фіг.10;
Фіг12 - графік, що ілюструє дію певної сполуки на рецептор-опосередковане продукування
Ф) інозиттрифосфату; ка Фіг.13 - графік, що ілюструє дію певної сполуки на кіназо-залежне фосфорилування білків;
Фіг.14 - графік, що ілюструє дію певної сполуки на фосфатазо-залежне дефосфорилування білків; во Фіг.15 - графік інформації про відносні внески, що демонструє детермінанти з їхніми відповідними значеннями внеску;
Фіг.16А-16Н - інші діаграми відносних внесків, що демонструють еквівалентність оцінних функцій.
Цей винахід буде описаний тепер докладніше. Крім того, з посиланням на графічні фігури будуть розглянуті варіанти його здійснення, яким віддається перевага. Наводиться також ряд прикладів того, як можна застосувати 65 цей винахід в різних галузях.
Відповідно до цього винаходу для проведення дискретного структурно-фрагментарного аналізу використовується комп'ютерна система. Здійснюються звернення до бази даних молекулярних структур. Ця база даних є такою, що є уможливленим проведення пошуку за інформацією про молекулу і біологічними і/або хімічними властивостями. Інформація про молекулярну структуру - це будь-яка інформація, придатна для визначення молекулярної структури молекули. Біологічні Мабо хімічні властивості включають біохімічні, фармакологічні, токсикологічні, пестицидні, гербіцидні і каталітичні властивості.
Використовуючи базу даних, спосіб, запропонований згідно з цим винаходом, ідентифікує підмножину молекул, що мають певну задану біологічну і/або хімічну властивість. Після цього у цій підмножині визначають фрагменти цих молекул. Термін "фрагмент" стосується будь-якого структурного елемента молекули, включаючи 7/0 прості функціональні групи, двовимірні підструктури і їхні сімейства, прості атоми або зв'язки, а також будь-якого набору структурних дескрипторів в двовимірному або тривимірному молекулярному просторі.
Фахівцеві буде зрозуміло, що фрагментом в цьому значенні може бути навіть молекулярна підструктура, що не має відомого значення в традиційній хімії.
Після того як молекулярні структури згаданої підмножини будуть розбиті на фрагменти, для кожного 7/5 фрагмента обчислюють рейтингове значення, що вказує внесок відповідного фрагмента в дану біологічну і/або хімічну властивість. Тобто винахід дозволяє призначати рейтингові значення фрагментам на основі існуючих знань про біологічні і/або хімічні властивості молекул. У подальшому описі молекула, структура або підструктура, яка має задану властивість, буде іменуватися "активною". Молекула, структура, або підструктура, що не є активною, буде іменуватися "неактивною". Таким чином, згідно з цим винаходом пропонується структурно-фрагментарний аналіз, базований на інформації про окремі (дискретні) біологічні і/або хімічні властивості. Тому основний процес винаходу буде іменуватися далі дискретним структурно-фрагментарним аналізом (О5А).
Оскільки відповідно до цього винаходу фрагментам поставлені у відповідність рейтингові значення, що характеризують їхній внесок в певну задану біологічну і/або хімічну властивість, фрагменти можна розглядати сч рб ЯК хімічні детермінанти, відповідальні за певний заданий біологічний і/або хімічний результат. Ідентифікація фрагментів здійснюється за допомогою певного набору логічних правил (алгоритму), які є частиною самого і) способу структурно-фрагментарного аналізу (ОА). У цьому контексті саме рейтингове значення є функцією від: (а) поширеності заданої хімічної детермінанти в підмножині, що включає активні молекули, і (б) поширеності цієї ж детермінанти у всьому переліку сполук, що перевіряються. «- зо На основі цього визначення запропонований спосіб потім визначає один або декілька локальних екстремумів згаданої рейтингової функції; хімічні детермінанти, які відповідають цим екстремумам, представляють повні або ме) часткові хімічні розв'язки для досягнення бажаного біологічного результату. Виявлення максимально можливих с значень, які рейтингова функція може приймати на будь-якому заданому наборі даних, еквівалентне ідентифікації хімічних детермінант, які містяться в підмножинах найбільш сильнодіючих біологічно активних Ме)
Зв молекул і для яких імовірність їх випадкової появи в цих підмножинах є найменшою. М
Нижче винахід буде описано із посиланням на графічні фігури, і, зокрема, на Фіг.1. На Фіг.1 представлений один з варіантів здійснення комп'ютерної системи, яким віддається перевага, запропонований згідно з цим винаходом. Ця комп'ютерна система включає в себе центральний блок 100 обробки даних, яким може керувати інтерфейсний засіб 105 користувача. Як блоки 100 і 105 може використовуватися будь-яка комп'ютерна система, « 0 така як робоча станція або персональний комп'ютер. У варіанті, якому віддається перевага, ця комп'ютерна з с система є багатопроцесорною системою з багатозадачною операційною системою.
Центральний блок 100 обробки даних підключений до пам'яті 130 для зберігання програм, в якій зберігається ;» виконуваний програмний код, що включає команди для здійснення структурно-фрагментарного аналізу (ОА) відповідно до цього винаходу. Ці команди включають функції 135 фрагментації - для розбиття молекулярних структур на фрагменти, рейтингові функції 140 - для обчислення рейтингових значень, функції 145 узагальнення -І (наприклад, для виділення ізомерів) - для виявлення у фрагментарних структурах елементів, що можуть бути узагальнені, і заміни цих елементів загальними виразами, створюючи таким чином узагальнені підструктури, і, функції 150 віртуального скринінгу - для виконання віртуального скринінгу, і функції 155 відпалу для ко виконання використовуваного згідно з цим винаходом відпалу фрагментів. Деталі окремих функцій і процесів, са 50 здійснюваних центральним блоком 100 обробки даних при виконанні цих функції, будуть описані докладніше нижче. ке Центральний блок 100 обробки даних підключений, крім того, до бази даних 115 активностей структур, або переліку активностей сполук, для отримання інформації про молекулярні структури і інформації про біологічні і/або хімічні властивості. Ця інформація може бути також отримана із блоку 110 введення даних, що уможливлює
Доступ до зовнішніх джерел даних.
Використовуючи звернення до блоків 110 і/або 115, підмножина молекулярних структур може бути отримана,
Ф) наприклад, із будь-якого доступного джерела, такого як корпоративна база даних або база даних спільного ко користування, яке дозволяє проведення пошуку за подструктурою і/або біологічними властивостями. Базами даних спільного користування є, зокрема, такі: МОЮОК, РНагтарго|есів, МегсК Іпдех, Зсігіпдег, Оеглепі. Така бо підмножина молекул може також бути отримана шляхом синтезу і дослідження сполук. Цими молекулами звичайно будуть повні сполуки, але є також можливим, щоб вони були фрагментами молекул. Для будь-якої заданої біологічної або хімічної властивості, ця підмножина включає як сполуки, що не мають цієї властивості, наприклад, сполуки, що не є активними (або активність яких не досягає певного заданого порога), так і сполуки, що мають цю властивість, наприклад, сполуки, що демонструють бажану активність (тобто з активністю б5 вище певного заданого порога). Всі неактивні сполуки є релевантними і тому аналізуються.
Після звернення до внутрішніх або зовнішніх даних і виконання процесу структурно-фрагментарного аналізу
(О5А) з використанням функцій, що зберігаються в пам'яті 130 для зберігання програм, центральний блок 100 обробки даних збережує бібліотеку 120 фрагментів, що включає певні фрагменти молекул разом із відповідними рейтинговими значеннями.
У одному варіанті здійснення цього винаходу, якому віддається перевага, бібліотека 120 фрагментів одержана в результаті виконання основного процесу відповідно до цього винаходу. Після цього ця бібліотека 120 фрагментів може використовуватися, наприклад, вченими-хіміками і біологами, або інженерами, як джерело цінної інформації, яке може використовуватися в будь-яких подальших дослідженнях.
У іншому варіанті, якому віддається перевага, ця бібліотека 120 фрагментів є проміжним результатом, 7/0 одержаним при виконанні основного процесу цього винаходу, і тому може зберігатися як в енергозалежній пам'яті, так і в енергонезалежній пам'яті. Відповідно до цього варіанту здійснення бібліотека 120 фрагментів може прочитуватися центральним блоком 100 обробки даних при виконанні інших функцій, що зберігаються в пам'яті 130 для зберігання програм, для створення колекції 125 сполук.
Колекція 125 сполук є колекцією молекул, у яких запропонованим згідно з цим винаходом процесом була /5 Виявлена наявність або відсутність бажаної біологічної і/або хімічної властивості. Молекули колекції 125 сполук можуть бути як вже відомими, так і гіпотетичними структурами, раніше не синтезованими. У будь-якому випадку, молекули колекції 125 сполук є результатом оцінки рейтингових значень, призначених фрагментам відповідно до дискретного структурно-фрагментарного аналізу.
Як видно на Фіг.1, центральний блок 100 обробки даних підключений також до пам'яті 160 даних, в якій зберігаються множини 165 сполук, множини 170 фрагментів і рейтингові значення 175. Пам'ять 160 даних передбачена для зберігання даних, тобто використовується для зберігання вхідних параметрів при виклику функцій 135-155, або для зберігання значень, що повертаються цими функціями.
Як показано на Фіг, що ілюструє варіант здійснення основного процесу дискретного структурно-фрагментарного аналізу (О5А), якому віддається перевага, спочатку оператор комп'ютерної системи, сч зображеної на Фіг.1, вибирає на кроці 210 певну активність. Як згадувалося вище, активність означає будь-яку біологічну і/або хімічну властивість, в тому числі біохімічні, фармакологічні, токсикологічні, пестицидні, о гербіцидні, каталізаторні властивості. Крім того, при використанні цього винаходу для ідентифікації сирітських лігандів, активністю може бути певний заданий вплив на білок, який представляє інтерес (як правило - зв'язування). «- зо У цьому тексті посилання на певну задану властивість, наприклад - біологічну активність, може бути, якщо інше не зумовлене контекстом, екстрапольоване на інші типи біологічної і/або хімічної властивості. Крім того, ме) щоб уникнути сумнівів, відзначимо, що терміни "сполука", "молекула" і "молекулярна структура" можуть, в с залежності від контексту, стосуватися як молекулярних підструктур, так і повних сполук.
Після вибору активності на кроці 210, на кроці 125 вибирається певна множина сполук. Вибрана множина Ме
Зв бполук є множиною молекул, які повинні бути досліджені для того, щоб дізнатися, які фрагменти вносять внесок М у вибрану активність. Як буде описано докладніше нижче, множина сполук, вибрана на кроці 220, включає в себе молекули, відомі як активні, і молекули, відомі як неактивні.
Після того як будуть вибрані активність і множина сполук, процес переходить до створення бібліотеки 120 фрагментів на кроці 230. Процес створення бібліотеки фрагментів може бути описаний як процес зважування « ефективності молекулярних фрагментів, що містяться в певній підмножині відомих структур, щодо певного з с хімічного і/або біологічного результату. Цей процес можна описати як такий, що включає такі етапи: . І. ідентифікація однієї або кількох підмножин молекул, що мають певні задані властивості, необхідні для а досягнення хімічного і/або біологічного результату, що представляє інтерес;
І. створення попередньої бібліотеки, що містить фрагменти молекул із згаданих однієї або кількох підмножин;
Ш. застосування алгоритму оцінки внеску цих фрагментів в хімічний і/або біологічний результат, що -І представляє інтерес; і
ІМ. отримання для кожного фрагмента, до якого застосовується цей алгоритм, рейтингового значення; ці і, рейтингові значення можуть ранжуватися за величиною - наприклад, тим фрагментам, які з більшою імовірністю ко зумовлюють хімічний і/або біологічний результат, що представляє інтерес, ставлять у відповідність більші рейтингові значення. о Як згадувалося вище, бібліотека 120 фрагментів включає фрагменти, а також отримані рейтингові значення як для цих фрагментів. Після створення бібліотеки 120 фрагментів на кроці 230 процес може виконати повторну ітерацію на кроці 240, а може і не виконувати Її.
Шляхом здійснення процесу структурно-фрагментарного аналізу (О5А) з використанням повторних ітерацій ов Можна досягнути дуже ефективного використання обчислювальних ресурсів. Наприклад, процес у варіанті, якому віддається перевага, починається з невеликих фрагментів. Оскільки кількість можливих фрагментів в
Ф) молекулярних структурах збільшується із збільшенням максимального розміру досліджуваних фрагментів ко приблизно експонентно, спочатку цей максимальний розмір встановлюється досить малим, так що можна обробити навіть дуже велику кількість молекулярних структур. во На кроках 210-230 виявляють фрагменти з високим внеском в бажану активність. Ці виявлені фрагменти можуть бути потім використані в наступній ітерації (циклі) для виявлення фрагментів більшого розміру, тобто з більшою молекулярною масою. Приклад процесу з повторними ітераціями зображено на Фіг.3. На першій ітерації було виявлено, що фрагмент С-О вносить великий внесок в бажану активність. Цей фрагмент потім використовують для пошуку фрагментів, які більші за розміром ніж фрагменти, виявлені на першій ітерації, і б5 при цьому включають в себе цей фрагмент. У зображеному на Фіг.3 прикладі друга ітерація показує, що фрагмент М-С-О є оптимальним фрагментом цього розміру щодо бажаної активності. Процес із повторними ітераціями продовжують, збільшуючи розміри фрагментів, внаслідок чого може бути виявлена сполука, яка, ймовірно, буде мати бажану біологічну і/або хімічну властивість і буде придатною для бажаного застосування.
Повернемося тепер до Фіг.2: якщо приймається рішення виконати на кроці 240 наступну ітерацію або цикл, бібліотеку 120 фрагментів, створену на кроці 230, аналізують на кроці 250, і процес повертається на крок 220.
Приклади аналізу бібліотеки 120 фрагментів на кроці 250 будуть описані докладніше нижче. Як стане зрозумілим, процес з повторними ітераціями дозволяє застосовувати більш продвинуті функції, такі як функції 145 узагальнення і функції 155 відпалу, щоб ще більш удосконалити дослідження із використанням дискретного структурно-фрагментарного аналізу. 70 Нарешті, після прийняття рішення про припинення ітерацій (крок 240), або після закінчення процесу з повторними ітераціями, на кроці 260 створюється колекція 125 сполук.
Повернувшись до кроку 230 створення бібліотеки 120 фрагментів, опишемо тепер докладніше, з посиланням на Фіг.4-6, варіант здійснення операцій цього процесу створення, якому віддається перевага. Спочатку, після звернення до внутрішньої бази даних 115 і/або зовнішнього джерела даних і ідентифікації певної підмножини /5 молекул, на кроці 410 отримують дані "активність-структура" для ідентифікованих молекул. Потім, на кроці 420 визначають фрагменти молекул в цій підмножині.
Молекули можуть бути фрагментовані за допомогою ряду відомих методів. Наприклад, може бути використаний певний алгоритм для виявлення будь-якої перестановки атомів, зв'язаних один з одним. Функції 135 фрагментації можуть використовувати мінімальний розмір фрагмента і максимальний розмір фрагмента.
Або, наприклад, алгоритм фрагментації міг би бути складений таким чином, щоб ігнорувати фрагменти, атоми в яких організовані лінійно. Крім того, в алгоритм можна було б ввести обмеження, які б передбачали включення або виключення певних заданих типів зв'язків. Існує багато різних способів застосування функцій фрагментації, відомих фахівцеві.
Таким чином, кожна з молекулярних структур може бути умоглядно розбита на ряд окремих підструктур або с фрагментів (крок 420). Цими фрагментами можуть бути прості функціональні групи, наприклад, МО», СООН,
СНО, СОМН».; точні двовимірні підструктури, наприклад, о-нітрофенол; нечітко-визначені сімейства о підструктур, наприклад, К-ОН; прості атоми або зв'язки, або будь-які набори структурних дескрипторів в двовимірному або тривимірному хімічному просторі.
Після розбиття молекул на фрагменти на кроці 420, на кроці 430 обчислюють рейтингові значення для цих «- зо Фрагментів, обчислюючи рейтингове значення для кожного фрагмента і ставлячи обчислене значення у відповідність з цим фрагментом. Після цього визначають фрагменти з найбільшими кількісними показниками ме) (крок 440) і зберігають їх (крок 450). с
Приклад того, як визначають фрагменти з найбільшими рейтинговими значеннями, зображений на Фіг.5. У цьому прикладі певні рейтингові значення представлені як функція кількості сполук, що містять відповідний Ме
Зз5 фрагмент. На цьому графіку кожний фрагмент представлений точкою. Використання цього графіка на кроці 440 М дає більше інформації, ніж просто вибір фрагментів із найбільшими рейтинговими значеннями шляхом порівняння цих рейтингових значень, оскільки при побудові цього графіка додатково використовується інформація про кількість сполук, в які входять відповідні фрагменти.
Процес виявлення максимально можливого рейтингового значення можна вважати еквівалентним побудові « Філогенної сітки фрагментів, відповідних певній заданій біологічній і/або хімічній активності. Тут вузли 7-3 с сітки утворені самими фрагментами, а імовірність того, що певний окремий фрагмент лежить в основі даної біологічної активності, представлена відстанню від відповідного вузла до початку, тобто основи самої сітки. ;з» Таким чином, чим більшим є рейтингове значення для певного заданого фрагмента, тим далі розташовується відповідний вузол від початку сітки і тим ймовірніше, що цей фрагмент являє собою хімічний розв'язок для,
Наприклад, фармакофора, що розпізнається заданою мішенню. -І Опишемо тепер докладніше з посиланням на Фіг.б крок 430 визначення рейтингових значень для фрагментів.
Застосування рейтингових функцій 140 відповідає вищезазначеному набору логічних правил, або і, обчислювальних операцій. Спосіб проведення структурно-фрагментарного аналізу (ОА), запропонований згідно
ГІ з цим винаходом, включає в одному з варіантів здійснення, яким віддається перевага, етап включення змінних, що характеризують поширеність кожного фрагмента, в одну або кілька математичних функцій, що визначають о рейтингове значення для будь-якого заданого фрагмента. як Згаданий алгоритм є функцією: (а) кількості х молекул в певній підмножині, які задовольняють певному заданому порогу щодо бажаного результату і містять певний фрагмент; (Б) кількості у молекул в згаданій підмножині, які містять згаданий фрагмент, незалежно від того, чи задовольняють вони згаданому пороговому значенню, чи ні; (Ф. (с) кількості 7 молекул в згаданій підмножині, які задовольняють згаданому порогу, незалежно від того, чи ка містять вони згаданий фрагмент, чи ні; і (4) кількості М всіх молекул в цій підмножині. 60 Результатом, про який йдеться в (а), може бути будь-який бажаний параметр, що відноситься до активності цих сполук, включаючи, але не виключно, біологічну, біохімічну, фармакологічну і/або токсикологічну активність. Кожна сполука або молекула в цьому наборі даних може бути потім проаналізована на наявність бажаного параметра, відносно певного заданого порога, такого як певний заданий рівень активності. Цей поріг можна встановити на будь-якому бажаному рівні. У подальшому описі "активною" сполукою буде іменуватися б5 така, яка задовольняє бажаному порогу, а "неактивною" сполукою іменуватися така, яка не задовольняє згаданому порогу. Ці терміни не виражають якої-небудь абсолютної властивості сполук, що розглядаються.
Внесок певного заданого фрагмента може бути визначений застосуванням до змінних х, у, 2 і М певної міри асоціації, або рейтингової функції 140. Як добре відомо фахівцям в даній галузі, існує безліч мір асоціації, які поділяються на три основні категорії:
Субтрактивні міри: наприклад, Мх-уг;
Пропорційні міри: наприклад, х(М-у-2-Х)(2-ХХ(У-Х);
Змішані міри: наприклад, (х/2)-(2-Х)(М-2).
Як стане очевидним, можуть бути вибрані будь-які міри асоціації, і фахівці легко зможуть зробити відповідний вибір. 70 Отже, застосований на кроці 430 алгоритм може включати (дивись Фіг.б): (Ї) визначення в певній підмножині кількості х сполук, які задовольнять певному заданому порогу відносно заданого хімічного або біологічного результату і містять певну задану хімічну детермінанту (крок 610); (її визначення у згаданій підмножині сполук кількості у сполук, які містять цю хімічну детермінанту, незалежно від того, чи задовольняють вони згаданому порогу чи ні (крок 620); (ії) визначення у згаданій підмножині сполук кількості 72 сполук, які задовольняють згаданому порогу, незалежно від того, чи містять вони цю хімічну детермінанту чи ні (крок 630); (ім) визначення в цій підмножині сполук загальної кількості М сполук (крок 640); і (М) застосування певної міри асоціації до двох або більш змінних х, у, 2 і М (крок 650), у варіанті, якому віддається перевага, трьох або чотирьох змінних, а у варіанті, якому віддається найбільша перевага, до всіх чотирьох змінних х, у, 2 і М.
Міра асоціації може бути застосована безпосередньо для визначення рейтингового значення, відповідного внеску певного заданого фрагмента. Проте у варіанті, якому віддається перевага, з міри асоціації виводять рейтингову функцію для оцінки імовірності того, що подструктура впливає на результат. Це сприяє більш чіткому ранжуванню рейтингових значень, отриманих для всієї сукупності проаналізованих фрагментів. З міри асоціації сч рейтингова функція може бути виведена відомими в цій галузі методами. Наприклад, ці методи можуть бути вибрані зі статистичних методів, таких як метод критичного співвідношення (7); точного критерію хі-квадрат і)
Фішера (Різпегз Ехасі їез!), критерію хі-квадрат Пірсона (Реаггоп); критерію хі-квадрат Мантеля-Хенцеля (Мапіє! Наеп?еї); і методи, базовані, але не виключно, на висновках за тангенсами кута нахилу кривих, тощо.
Однак крім статистичних, можуть використовуватися й інші методи. Такі методи включають, але не виключно, - де зо обчислення і порівняння точних і приблизних довірчих інтервалів, коефіцієнтів кореляції, або навіть будь-якої функції, яка включає в себе міри асоціації, що включають поєднання однієї, двох, трьох описаних вище змінних ме) х,у, 21М. с
Прикладами математичних формул, що представляють міри асоціації або рейтингові функції, які можуть бути застосовані в цьому винаході, є: Ме) (І) х/2 ї- (І) х/М (ПО) Мх-ух (ІМ) (бк/2)-(у/М) « (М) буг)-(2-юМ-2) шо Му чк) з 5 (с-хуу-т) (МІ) Мк - уг - уг(м-2укм-У) со (МИ еууаюдм-х))
ІХ зо (нк-уд-м/2ум) пенні нання що 2-23 у) - с) кМ-у-жнх) ай кду-юуюідх-к зн дМм-у-ткк) й (г-хщу-х) о Є хм -у-гі хг - ходу - хо) з ха уж хода ху - ху во (ХІ)
ТУ у к-увум -а | у 2-2 У) 65 Фахівець упізнає в рейтинговій функції (МІ) Пірсоновський коефіцієнт кореляції, що відображає ступінь розподіленої між двома дихотомічними змінними дисперсії, явно не показаної в цій формулі.
Фахівцеві в цій галузі очевидно, що рейтингова функція (МІ) відноситься до оцінки коефіцієнта ризику з використанням нахилу лінії регресії, що представляє ступінь розподіленої між двома дихотомічними змінними дисперсії.
Фахівець упізнає в рейтинговій функції (ІХ) статистику "хі-квадрат", перетворену для обліку різних змішуючих чинників. Наприклад, член М/2 в чисельнику другого відношення добутку, що перераховується в логарифмічному масштабі, являє собою узгодження із запасом нормальної апроксимації з біномінальним розподілом, що вельми корисно у випадку відносно малих величин х, у, 72 або М. Фахівець зрозуміє, що замість описаних в формулах (І) і (І) мір асоціації, найбільш придатна з яких, в значенні цього винаходу, містить 70 різні поєднання однієї, двох, трьох або чотирьох змінних х, у, 2 або М, для цієї ж мети можна використати інші міри асоціації і/або рейтингові функції.
Фахівець упізнає в рейтинговій функції (Х) засіб оцінки значення нижньої межі 9595 довірчого інтервалу міри (І) шляхом використання логарифмічного перетворення, щоб зробити розподіл коефіцієнта більш порівнянним із нормальним розподілом, і апроксимацію першого порядку ряду Тейлора для оцінки дисперсії /5 логарифма цього ж коефіцієнта.
Фахівець упізнає в рейтинговій функції (ХІ) спосіб порівняння випадкових коефіцієнтів, що дозволяє визначити хімічні детермінанти, які найбільш придатні бути вибраними для його мети серед інших.
Фахівцю буде зрозуміло, що рейтингова функція (ХІІ) уможливлює поєднання декількох критеріїв асоціації, дозволяючи ідентифікувати хімічні детермінанти, для яких імовірність того, що вони водночас впливають на дві або кілька заданих властивостей, є найбільшою.
Фахівцю буде зрозуміло також, що рейтингову функцію можна перетворити до такого вигляду, щоб вона включала додаткові змінні, які б стосувалися речовинних, біологічних, хімічних і/або фізико-хімічних властивостей молекули. Наприклад, такі перетворення могли б включати в себе (але не виключно) поправки на дієвість, селективність, токсичність, біологічну доступність, стабільність (метаболічну або хімічну), сч р; Можливість синтезу, чистоту, наявність на ринку, доступність відповідних реагентів для синтезу, вартість, молекулярну масу, молярну заломлюючу здатність, молекулярний об'єм, логарифм імовірності (ІсоР) і) (обчислений або визначений), кількість приймаючих водневі зв'язки груп, кількість віддаючих водневі зв'язки груп, заряди (парціальні і формальні), константи протонування, кількість молекул, що містять додаткові хімічні цільові компоненти або дескриптори, кількість здатних обертатися зв'язків, показник гнучкості, «- зо показники форм молекул, схожості орієнтаційного упорядкування і/або об'єми перекриття.
Таким чином, наприклад, рейтингову функцію (МІ) можна перетворити, наприклад, для урахування ме) молекулярної маси (ММУ) кожної хімічної детермінанти, що розглядається, таким чином: с
ММ. еібду(аеу(М-т)|.
Аналогічним чином, рейтингову функцію (ІХ) можна перетворити до такого вигляду, щоб вона включала змінні б
ММ ї ІЗ), що відповідно представляють молекулярну масу (ММУ) хімічної детермінанти, що розглядається, і рч- кількість появ цієї хімічної детермінанти в підмножині активних сполук х (51), таким чином: (І) Рейтинг - ,; я фік -уд- м/аЇ м «
Год НН і ГІ ги- 2г/Кн- У З - для ідентифікації при здійсненні аналізу найбільших, одноточкових, біологічно активних хімічних детермінант. ,» Результат кроку 650 алгоритму дає рейтингове значення для даного фрагмента. Кроки 610-650 алгоритму можуть бути повторені для кожного вибраного фрагмента з даних. Після обчислення рейтингових значень для всіх вибраних фрагментів одержують рейтингові значення, які відповідають потенційній ефективності кожного із -і проаналізованих фрагментів. Рейтинги можуть ранжуватися за їх значеннями; наприклад, фрагментам, для яких со імовірність того, що вони зумовлюють заданий хімічний і/або біологічний результат, є більшою, ставляться у відповідність більші рейтингові значення. Це уможливлює здійснення на кроці 440 ідентифікації одного або ко кількох локальних екстремумів значень рейтингової функції, так що хімічні детермінанти, які їм відповідають, с 50 представляють повні або часткові розв'язки для досягнення бажаного хімічного або біологічного результату.
Знаходження найбільших рейтингових значень, які можуть бути отримані в будь-якому заданому наборі даних, - еквівалентне ідентифікації хімічних детермінант, які містяться в підмножинах молекул, що мають бажані властивості, причому таких хімічних детермінант, що імовірність їх випадкового з'явлення у цих підмножинах є мінімальною. У тому випадку, коли бажана властивість є певною заданою біологічною активністю, фрагменти або
Хімічні детермінанти з найбільшими рейтинговими значеннями є біологічно активним фармакофором.
Повернувшись до Фіг.2, розглянемо тепер варіанти, яким віддається перевага, здійснення кроку 250 аналізу о бібліотеки 120 фрагментів. ко Один зі способів аналізу бібліотеки 120 фрагментів зображений на Фіг.7. Процес починається з вибору фрагмента на кроці 710, виходячи з рейтингових значень, визначених при здійсненні попередньої ітерації. 60 Потім, на кроці 720, добувають сполуки, які включають вибраний фрагмент, з поточної множини сполук. Оскільки на кроці 710 був вибраний фрагмент, вплив якого на бажану активність є великим, сполуки, що добуваються на кроці 720, можна розглядати як активні сполуки. Після цього (крок 730) вибирають певну множину неактивних сполук, або зі згаданої поточної множини сполук, або з баз даних, або з будь-якого іншого джерела. Після цього активні і неактивні сполуки об'єднують на кроці 740 для утворення нової множини сполук. Потім на кроці 65 220 цю нову множину сполук вибирають як множину сполук для створення бібліотеки фрагментів при здійсненні наступної ітерації і виконують наступний цикл.
Тепер, із посиланням на Фіг.8, буде описаний один із варіантів здійснення кроку 730, яким віддається перевага. У цьому варіанті здійснення для вибору нової множини сполук для наступної ітерації використовуються родові підструктури.
Представлений на Фіг.8 процес починається з аналізу на кроці 810 структури фрагмента, вибраного на кроці 710. При втілені варіанту винаходу з узагальненням фрагмент, що його вибирають на кроці 710, може бути вибраний шляхом оцінювання рейтингового значення, обчисленого на попередній ітерації. Крім того, вибір фрагмента може бути зроблений в залежності від додаткових чинників, що впливають на придатність цього фрагмента бути початковим точкою для узагальнення. Ця придатність могла б визначатися кількістю атомів або 7/о зв'язків, тим, як ці атоми зв'язані, тривимірною структурою відповідного фрагмента тощо.
Після здійснення аналізу цього вибраного фрагмента на кроці 810, на кроці 820 в структурі цього фрагмента знаходять узагальнюваний елемент. Цей елемент потім замінюється на кроці 830 загальним виразом; як результат, одержують родову підструктуру (наприклад, щоб знайти біологічні ізостери). Прикладом є сь
І
(Ан с з (8) де у вибраному фрагменті були виявлені і замінені загальними виразами (Аг| і А два узагальнюваних елементи, де (Аг| представляє ароматичний центр, і А представляє С або 5. --
Створена на кроці 830 родова підструктура використовується для здійснення віртуального скринінгу для с знаходження нових сполук із такою родовою підструкгурою. Термін "віртуальний скринінг" стосується будь-якого процесу скринінгу, який виконується лише з даними, завдяки чому відпадає необхідність синтезувати сполуки. Ге!
Нові сполуки, виявлені за допомогою віртуального скринінгу, використовують на кроці 850 для створення нової б» множини сполук, які потім можуть бути використані на наступній ітерації.
Як видно на Фіг.9, процес віртуального скринінгу можна розділити на внутрішні і зовнішні модифікації че фрагментів, що їх модифікують з використанням родових підструктур. Внутрішні модифікації (крок 910) включають заміщення, вставки, видалення і інверсії атомів у фрагменті. Починаючи з вищезазначеного конкретного фрагмента і узагальнюючи цей фрагмент у родову підструктуру, в наступному прикладі одержують « три різні заміни: -
І.Й и? - -і се) т ю -у лан ш-е (95) а Конкрет- Родова Її
Я Зам ї
Зовнішні модифікації (крок 920) полягають у зміні замісників для фрагмента. Вони можуть бути випадковими, цілеспрямованими тощо. 60 б5
Рода Есикриний о Най
Б. І й - - г - ' - - й МО
Цілеспрямовані множини сполук - це колекції молекул, одержані шляхом модифікації однієї або кількох сч родових підструктур: о
Ї а (4 сне 9
І «- 30 . (зе) і. г . Га
Ї ч (о) і -
Д - с
І.Й и? -і Хоч на Фіг.9 показано, що кроки внутрішньої і зовнішньої модифікацій виконуються послідовно, фахівцеві со буде очевидно, що за рамки цього винаходу не вийде виконання тільки одного з цих видів модифікацій, або виконання обох модифікацій в іншій послідовності, або навіть паралельно. Слід відзначити, що результатом ко віртуального скринінгу є диверсифікована колекція сполук, що мають високий шанс виявитися активними, с 50 оскільки вони збагачені підструктурами, які асоціюються з активністю.
Хоч на кроці 710 вибирають один фрагмент, який виступає як основа для застосування функцій 145 - узагальнення для отримання родової підструктури, відповідно до ще одного варіанту здійснення цього винаходу, якому віддається перевага, для створення родових підструктур вибирають більшу кількість фрагментів із великими рейтинговими значеннями. Наприклад, як було виявлено, нижченаведені фрагменти характеризуються високими внесками в бажану активність, і вони можуть бути вибрані на кроці 710: ко їі с, я ай пійШнь я "М вв 60 б5 ' І К І
Після цього ці вибрані фрагменти перетворюють у родові підструктури з високими рейтинговими значеннями, наприклад: й АроматнчниЕй 377 / А
Ці родові підструктури потім використовують для віртуального скринінгу наявних на ринку баз даних 10 І 15 .
Й шк 6. с о ш «-
Зо - со с (о) : - або внутрішньокорпоративних колекцій сполук.
Хоча, як було зазначено, процес з повторними ітераціями є ефективнішим щодо використання « обчислювальних ресурсів, оскільки доцільно починати з невеликих фрагментів і збільшувати розмір фрагментів з кожною ітерацію, і хоча, крім того, було показано, що ефективність може бути ще більше збільшена шляхом - с використання узагальнення при здійсненні процесу з повторними ітераціями, цей винахід передбачає ще один "з підхід, що дозволяє ще більш удосконалити процес дискретного структурно-фрагментарного аналізу, я запропонованого згідно з цим винаходом. Цей інший підхід базується на методиці віддалення і буде описаний нижче з посиланням на Фіг.10.
У представленому на Фіг.10 варіанті здійснення, якому віддається перевага, крок 250 аналізу бібліотеки -і фрагментів, яка була створена на попередній ітерації, починається з кроків 1010 і 1020 вибору першого і с другого фрагментів. Обидва фрагменти вибирають на основі обчислених рейтингових значень, і їх можна вважати фрагментами, що вносять великий внесок. ко На наступному кроці 1030 для сполучення цих першого і другого фрагментів застосовується функція 155 с 50 відпалу. Сполучення фрагментів означає визначення молекулярної структури або підструктури, що включає в себе обидва фрагменти. Для цієї мети можуть використовуватися декілька функцій 155 відпалу. Ці функції -. й відпалу відрізняються реалізацією того, як оцінюються і використовуються певні параметри відпалу.
Параметрами відпалу є, наприклад, відстань (заздалегідь задана) між першим і другим фрагментами, тривимірна орієнтація першого і другого фрагментів, кількість атомів, вставлених між цими фрагментами, кількість
Зв'язків, що використовуються для "склеювання" цих фрагментів, вид зв'язків і атомів тощо. о Крім того, відпал у варіанті, якому віддається перевага, поєднується з описаним вище аспектом, що використовує узагальнення. Якщо, наприклад, на кроках 1010 і 1020 вибирають фрагменти, про які відомо, що у ко них високі рейтингові значення, в функції відпалу, яку вибирають на кроці 1030 і виконують на кроці 1040, для сполучення фрагментів можна б використати узагальнений вираз 60 Е1-І61-г2
Загальний вираз |С| є синонімом молекулярних підструктур із певними заданими властивостями і параметрами відпалу і залежить від використовуваної функції відпалу.
Після сполучення фрагментів, за допомогою точних або загальних виразів, на кроці 1040 створюють нову множину сполук, в яку входять обидва фрагменти. Приклад молекули з цієї нової множини сполук представлений 65 на Фіг.11, що є двовимірною діаграмою відносних внесків, яка показує відносний внесок відносно локальних координат. Як видно на Фіг.11, є два локальних екстремуми - рейтингові значення приблизно 1,2 і 1,7 для фрагментів Е1 і Е2.
Процес відпалу має дві переваги. Першою його перевагою є те, що шляхом сполучення двох фрагментів із високими внесками в бажану активність можна отримати більші молекули, які можуть виявитися ефективними - оскільки вони включають не один, а декілька фрагментів із великими рейтинговими значеннями. Відповідно, значною буде імовірність того, що у структур, що їх одержують, рейтингове значення виявиться більшим, ніж максимальне із рейтингових значень для цих двох окремих фрагментів.
Наприклад, у випадку, зображеному на Фіг.11, одержана в результаті сполука включає фрагменти, що мають рейтингові значення 1,2 і 1,7, але рейтингове значення для всієї структури може дорівнювати, наприклад, 21. 7/0 Тому метод відпалу навіть дозволяє одержувати сполуки з ще більш високою активністю.
Другою перевагою є те, що метод відпалу дозволяє уникати тупикових ситуацій в обчислювальному процесі.
Як видно на Фіг.11, значення відносних внесків відображені двома локальними екстремумами. При виконанні процесу з повторними ітераціями, зображеного на Фіг.3, який починає з невеликих фрагментів і на кожній ітерації якого розміри фрагментів збільшуються, в тому випадку, якщо вибраний фрагмент на одному із 7/5 проміжних кроків виявиться на локальному максимумі, може виникнути тупикова ситуація.
Наприклад, коли в кінці другої ітерації вибирають фрагмент М-С-О і цей фрагмент знаходиться на локальному максимумі, наступна ітерація не буде успішною. Як описано вище, фрагменти для наступної ітерації у варіанті, якому віддається перевага, будуються з відібраного на попередній ітерації фрагмента шляхом покрокового збільшення розмірів фрагмента. Таким чином, який би атом не додавався до вибраного фрагмента, го наступна ітерація змістить цей фрагмент в сторону від локального максимума. Тобто в цьому випадку у будь-якого одержаного в результаті фрагмента рейтингове значення буде нижчим, ніж у фрагмента, вибраного на попередній ітерації.
Щоб уникнути такої тупикової ситуації, може бути застосована методика відпалу шляхом вибору двох фрагментів із попередньої ітерації з високими рейтинговими значеннями, сполучення цих фрагментів, сч обчислення нового рейтингового значення і продовження процесу. Це можна виконувати періодично, від ітерації до ітерації, або при виявленні тупикової ситуації. і)
Хоч цей винахід був описаний із використанням ряду варіантів здійснення, яким віддається перевага, фахівцю в цій галузі буде очевидно, що цей винахід ніяким чином не обмежено цими варіантами. Наприклад, може бути змінена послідовність здійснення кроків, показаних на блок-схемах, або кроки, показані як такі, що «- зр Виконуються послідовно, можна було б навіть виконувати паралельно: дивись, наприклад, кроки 1010 і 1020 способу, показаного на Фіг.10. і)
Більш того, фахівцеві буде очевидно, що не всі показані етапи способу потрібні в кожному випадку. с
Наприклад, в показаному на Фіг.б процесі визначення рейтингових значень параметри, що не використовуються рейтингового функцією, обчислювати немає необхідності. Крім того, ці параметри можна було б обчислювати, Ме зв Використовуючи багатозадачну або багатопотокову операційну систему. ї-
Нижче будуть описані як приклади інші варіанти здійснення цього винаходу.
Наприклад, бібліотека фрагментів, що створюється на кроці 230, теоретично може містити всі можливі фрагменти і їх комбінації. Практично це можна досягти шляхом створення бібліотеки за допомогою комп'ютера.
Однак, якщо бібліотека створюється вручну, найімовірніше вона буде містити лише певну вибірку із всіх « Можливих фрагментів. Відповідно, спосіб можна повторювати, використовуючи комбінації фрагментів, зокрема, пе) с комбінації фрагментів, для яких за результатами попереднього аналізу були отримані високі рейтингові значення. ;» Таким чином, після первинного аналізу фрагментів ті фрагменти, які ймовірніше усього вносять внесок у бажаний хімічний і/або біологічний результат, можуть бути скомбіновані, і до них може бути застосований алгоритм для оцінки внеску об'єднаного фрагмента в бажаний хімічний і/або біологічний результат, як описано -І вище. Отримане рейтингове значення може бути порівняне з рейтинговими значеннями окремих фрагментів, щоб перевірити, чи призводить таке поєднання до збільшення внеску в бажаний хімічний і/або біологічний іс, результат. ко У ще одному варіанті здійснення цього винаходу можна було б виділити із фрагментів, що вносять найбільші внески у бажаний хімічний і/або біологічний результат, спільний структурний елемент, щоб визначити, чи є о внесок цього спільного елемента таким самим або більшим, ніж у початкових фрагментів.
Кк Фрагменти з найвищими рейтинговими значеннями є хімічною детермінантою або молекулярним фінгерпринтом, що мають найбільшу вагу за внеском в певний заданий хімічний або біологічний результат.
Після ідентифікації цього фінгерпринта можна потім створити бібліотеку сполук, що містять цю хімічну ов детермінанту (або детермінанти). Сполуки можна отримати за допомогою певної програми синтезу, орієнтованої на задану структурну ознаку. Як альтернативний варіант, сполуки, що містять цю хімічну детермінанту, можна
Ф) ідентифікувати за комерційними каталогами і придбати з відповідних джерел. Ці сполуки необов'язково повинні ка бути фармакологічної чистоти і можуть бути доступні з найрізноманітніших джерел.
Після того як бажана бібліотека буде зібрана, її можна піддати скринінгу за мішенню (мішенями), що бо представляє (представляють) інтерес. Як результат цього скринінгу можуть бути виявлені сполуки, досить активні для подальшого дослідження, або можуть бути отримані базові сполуки для програми синтезу. Спосіб дискретного структурно-фрагментарного аналізу (ОЗА), запропонований згідно з цим винаходом, дозволяє створювати диверсифіковані, проте високоспеціалізовані бібліотеки, щодо конкретної біологічної або фармакологічної мети. Таким чином набагато підвищується імовірність досягнення успіху при скринінгу, що його 65 проводять для виявлення активних сполук і/або корисних базових сполук.
У ще одному варіанті здійснення пропонується спосіб ідентифікації молекул, що мають певні задані бажані властивості, таких як біологічно активні молекули, який включає: - у певній підмножині молекул, визначення ваги внесків молекулярних фрагментів у досягнення певного заданого хімічного або біологічного результата, як описано вище; - ідентифікацію одного або кількох фрагментів із максимальною вагою; - складання певної множини сполук, що містять один або кілька таких фрагментів; - необов'язково - перевірку цих сполук на наявність бажаних властивостей.
Зрозуміло, що даний спосіб може рівною мірою використовуватися для ідентифікації фрагментів, що зумовлюють небажані властивості, наприклад, негативні біологічні побічні ефекти, і, відповідно, для 7/0 Виключення з розгляду сполук, що включають такі фрагменти.
Таким чином, шляхом здійснення запропонованого згідно з цим винаходом способу створюються структурні гіпотези (фрагменти), імовірність зумовлення, якими певного заданого біологічного, біохімічного, фармакологічного або токсикологічного результату оцінюється шляхом обчислення кількісного рейтингового значення. Приймаючи до уваги рейтингове значення для певного фрагмента, розробник лікарських засобів може /5 ухвалювати обгрунтовані рішення щодо підходу, який забезпечуватиме досягнення бажаної мети із найбільшою імовірністю, такої як ідентифікація сполук з сильнішою дією, відкриття нової серії активних сполук, ідентифікація сполук, що характеризуватимуться більшою селективністю або вищою біодоступністю, або позбавлення токсичної дії.
Спосіб, запропонований згідно з цим винаходом, зосереджується на фрагментах, наявних в підмножині сполук, що представляють інтерес, завдяки чому усувається необхідність у виконанні ресурсномістких обчислень для обширних, але, найімовірніше, менш релевантних секторів хімічного простору. Це призводить до скорочення обсягів обчислювань, необхідних для пошуку розв'язки задачі досягнення певного заданого біологічного результату, в той же час зберігаючи базовий рівень розуміння на молекулярному рівні, необхідний для теоретичного допущення існування біологічно активних хімічних детермінант. сч
Як говорилося вище, процес, запропонований згідно з цим винаходом, передбачає пошук локальних екстремумів однієї або кількох функцій, які можна підібрати таким чином, щоб вони відповідали ймовірностям, і) що наводяться в звичайних статистичних таблицях. Отже, надається гарний спосіб оцінки потенційного внеску певного заданого фрагмента в хімічний або біологічний результат. Однак для здійснення цього винаходу необов'язково базувати аналіз на статистичній теорії. «- зо Спосіб виконання дискретного структурно-фрагментарного аналізу (ОА), запропонований згідно з цим винаходом, може використовуватися в розв'язанні широкого кола прикладних задач, що постають в процесі о створення нових лікарських засобів. Як було описано вище, цей спосіб дозволяє виявляти фармакофори, які із с високою імовірністю обумовлюють певну задану біологічну активність, наприклад, речовин-антагоністів рецепторів 7-ГМ, інгібіторів кінази, інгібіторів фосфатази, речовин, що блокують іонні канали, інгібіторів Ме
Зв протеази, а також активних фрагментів пептидергічних лігандів, що зустрічаються в природі. М
Цей спосіб також дозволяє виявляти ендогенні модулятори мішеней лікарських засобів, полегшуючи ідентифікацію нових осей фармакологічного втручання, а також ефективне надання нових фармакологічних властивостей молекулам, раніше позбавленим таких властивостей.
Цей спосіб може бути також використаний для виявлення хибнопозитивних і хибнонегативних результатів в « наборах даних, наприклад, отриманих як результат високопродуктивного скринінгу (НТ). Дискретний з с структурно-фрагментарний аналіз (ОА) може також застосовуватися для прогнозування селективності сполук, наприклад, шляхом виявлення потенційно небажаних сторонніх ефектів. ;з» Таким же чином цей спосіб може використовуватися для прогнозування токсичних властивостей сполуки шляхом ідентифікації її "токсикофорних" хімічних детермінант, що, у поєднанні з описаним вище, дозволяє будувати бази даних хімічних детермінант, які можуть бути дуже корисними при виборі хімічних рядів. У цьому -І контексті цей спосіб, крім того, дозволяє ефективно додавати нові фармакологічні властивості хімічним сполукам, раніше позбавленим таких властивостей. Нарешті, завдяки своїй здатності визначати рівень і, молекулярної різноманітності, найбільш ефективний для досліджень шляхом скринінгу, спосіб виконання ко дискретного структурно-фрагментарного аналізу (ОА) дозволяє здійснити ефективні, з широким застосуванням паралелізму, автоматизовані процедури високопродуктивного скринінгу, що є суттєвим поліпшенням в порівнянні о з високопродуктивними (НТР) стратегіями, що використовуються в цей час.
Кк Зрозуміло, що в описаному вище способі щонайменше один етап здійснюється комп'ютерною системою.
Відповідно, наприклад, значення х, у, 72 і М, отримані з бази (баз) даних, можуть бути введені у відповідним чином запрограмований комп'ютер і оброблені ним. Отже, цей винахід поширюється на подібні здійснювані під керуванням або втілені за допомогою комп'ютера способи.
З наведеного вище опису зрозуміло, що цей винахід пропонує новий спосіб швидкого виявлення молекул, що (Ф. мають певні задані властивості, таких як біологічно активні молекули. Зокрема, винахід стосується способу ко зважування молекулярних структур з метою виявлення біологічно активних компонентів молекулярних структур і використання цих компонентів при побудові спеціалізованих колекцій хімічних сполук для підвищення бо ефективності процесу створення нових лікарських засобів і зменшення пов'язаних з цим витрат.
Пропонується спосіб збільшення частки біологічно активних сполук у певній заданій множині хімічних об'єктів, щодо яких немає відомостей про наявність у них бажаної біологічної активності. Згаданий спосіб передбачає застосування різних математичних методів для визначення кількісних залежностей структура-активність" (О5АК). Цей новий спосіб, який можна назвати дискретним структурно-фрагментарним б5 аналізом (О5А), наприклад, надає розв'язання проблеми розпізнавання фармакологічної моделі впливу, тобто проблеми ідентифікації хімічних детермінант (СО), які відповідальні, в певній заданій сполуці, за який-небудь заданий хімічний або біологічний результат, яким може бути, наприклад, біологічна, біохімічна, фармакологічна, хімічна і/або токсикологічна активність.
Спосіб, запропонований згідно з цим винаходом, має широке застосування і не обмежений фармацевтичною галуззю. Розглядаючи біологічно активні сполуки, цей спосіб можна застосовувати, наприклад, до пестицидів і гербіцидів, де бажаною біологічною активністю є відповідно пестицидна і гербіцидна активність. Цей спосіб може також використовуватися при моделюванні реакцій, де бажаними властивостями є швидше хімічні, ніж біологічні, властивості, наприклад, при створенні каталізаторів.
Як буде зрозуміло, методика, передбачена цим винаходом, полягає в об'єднанні в рамках певної підмножини 7/0 сполук, або різних підмножин сполук, тих фрагментів, для яких ймовірність того, що саме вони вносять внесок в хімічний і/або біологічний результат, що представляє інтерес, є найбільшою, і застосуванні певного алгоритму для оцінки внеску цього складеного фрагмента у згаданий хімічний і/або біологічний результат, що представляє інтерес, причому отримане рейтингове значення може бути порівняне з рейтинговими значеннями окремих фрагментів, щоб перевірити, чи призводить об'єднання до підвищення внеску в хімічний і/або біологічний /5 результат, що представляє інтерес.
Крім того, винахід дозволяє виділяти з цих фрагментів, що вносять найбільший внесок в хімічний і/або біологічний результат, що представляє інтерес, певної спільної структурної частини, щоб визначити, чи є внесок цієї спільної частини таким самими або вищим, ніж внески початкових фрагментів.
Більш того використовується міра асоціації, яку у варіанті, якому віддається перевага, вибирають з субтрактивних мір, пропорційних мір і змішаних мір. Ця міра асоціації у варіанті, якому віддається перевага, вводиться у рейтингову функцію, або останню будують на основі міри асоціації. Рейтингова функція може бути побудована за допомогою певного статистичного методу, такого як метод критичної пропорції, точний критерій
Фішера, критерій хі-квадрат Пірсона, критерій хі-квадрат Мантеля-Хенцеля, методу висновків за тангенсом кута нахилу кривих тощо. У ще одному варіанті здійснення, якому віддається перевага, ця рейтингова функція сч о5 будується за допомогою методу, вибраного з обчислення і порівняння точних і наближених довірчих інтервалів, коефіцієнтів кореляції або будь-якої функції що явно включає в себе певну міру асоціації що включає і) будь-яке поєднання однієї, двох, трьох або чотирьох змінних: х, у, 2 і М.
У варіанті, якому віддається перевага, винахід виконує операцію вибору молекул, що містять найбільш рейтингові фрагменти, як потенційних лігандів, і, необов'язково, подальшу перевірку того, чи є вони «- зо Ммодуляторами мішеней лікарських засобів. Спосіб, запропонований згідно з цим винаходом, у варіанті, якому віддається перевага, може бути використаний для ідентифікації хибнопозитивних і/або хибнонегативних і) експериментальних результатів. Іншими застосуваннями, яким віддається перевага, є пошук схожості, аналіз с різноманітності і/або аналіз відповідності.
Нижче наводяться приклади, що демонструють численні застосування способу дискретного б»
Зв структурно-фрагментарного аналізу (ОА), запропонованого згідно з цим винаходом. Ці приклади є варіантами М. здійснення цього винаходу, яким віддається перевага, і служать для його ілюстрації, але не повинні розглядатися як такі, що обмежують його обсяг.
Приклад Мо1. Ефективна ідентифікація нових і селективно діючих лігандів рецептора
З використанням препарата рекомбінантної мембрани і міченого радіоактивним ізотопом пептиду було « проведено дослідження конкурентного зв'язування для рецептора клітинної поверхні. В рамках цього з с дослідження була приготована колекція сполук для перевірки, і в ході цієї перевірки з використанням способу, запропонованого згідно з цим винаходом, були виявлені нові ліганди рецептора. Перший етап полягав в ;» складанні переліку з 208 структур-антагоністів цього рецептора шляхом огляду наукової літератури, наявної на сьогоднішній день. Другий етап полягав в ідентифікації біологічно активних хімічних детермінант, що містяться
В цих 208 лігандах рецептора. Для цього був утворений додатковий перелік, що містив 101130 структур, які -І раніше описувалися в літературі як такі, що не впливають на цей рецептор, і доданий до першого переліку.
Одержаний в результаті перелік з 101338 структур був проаналізований на присутність біологічно активних і, хімічних детермінант шляхом вибору субтрактивної міри асоціації (І), де х - кількість активних хімічних ко структур, що містять хімічну детермінанту, що представляє інтерес, у - загальна кількість хімічних структур, 5р що містять цю детермінанту, 72 - загальна кількість активних хімічних структур в множині з М молекул (тобто о 727-208), і М - загальна кількість хімічних структур, що є предметом аналізу (тобто М-101388). -З () Мх-ух
На основі міри асоціації (І) була побудована рейтингова функція (І), в якій фахівець упізнає опосередковану міру імовірності події, модифіковану для урахування різних змішуючих чинників. Наприклад, дв член М/2 в чисельнику другого відношення добутку уможливлює консервативне врахування нормальної апроксимації з біномінальним розподілом, що вельми корисно у випадку відносно малих величин х, у, 2 і М.
Ф) Змінні ММУ і І5), що відповідно представляють молекулярну масу (ММУ) хімічної детермінанти, що представляє ка інтерес, і кількість разів (І5)), що ця хімічна детермінанта зустрічається у цій підмножині активних сполук х, були включені в цю рейтингову функцію для того, щоб полегшити ідентифікацію в ході аналізу максимально бо великих одноелементних біологічно активних хімічних детермінант. Фахівець зрозуміє, що інші міри асоціації мабо рейтингові функції можуть бути використані для цієї ж мети замість описаних в формулах (1) і (Ії), найбільш ефективні з яких, в контексті цього винаходу, включають в різних поєднаннях дві, три або чотири змінніх, у, 2 і М. б5
(І) Рейтинг - ,; я фк-уд-м/2) М
Геда- ЗШЗВЬ»-и (З Зі. 1 ОЗ 3 ІІ ам-2гуКн- у)
Фахівцю буде також зрозуміло, що рейтингову функцію (ІІ) можна було б додатково модифікувати так, щоб вона містила додаткові змінні, які б характеризували речовинні, біологічні, хімічні і/або фізико-хімічні властивості молекули. Наприклад, такі модифікації могли б включати (але в жодному разі не лише це) 70 урахування дієвості, селективності, токсичності, біологічної доступності, стабільності (метаболічної або хімічної), можливості синтези, чистоти, наявності на ринку, доступності реагентів для синтезу, вартості, молекулярної маси, молярної заломлюючої здатності, молекулярного об'єму, логарифму імовірності (ІсоР) (обчисленого або визначеного), поширеності підструктури в колекції подібних до ліків молекул, загальної кількості і/або типів атомів, загальної кількості і/або типів хімічних зв'язків і/або орбіталей, кількості 75 приймаючих водневий зв'язок груп, кількостей віддаючих водневий зв'язок груп, зарядів (парціальних і формальних), констант протонування, кількості молекул, що містять додаткові хімічні базові компоненти або дескриптори, кількості здатних обертатися зв'язків, показників гнучкості, показників форми молекули, схожості орієнтаційного упорядкування і/або об'ємів перекриття.
Аналіз 101338 структур призвів до ідентифікації восьми окремих хімічних детермінант, із молекулярною 2о масою в діапазоні 150-23О0Да і імовірністю зустрічання в підмножині активних хімічних структур завдяки чистому випадку менше ніж 1 на 10000 (р«е0,0001). Відповідно ці вісім детермінант були прийняті як такі, що представляють одну або кілька біологічно активних компонентів 208 лігандів рецептора, отриманих із літератури, і були зібрані в четвертий перелік. Потім були здійснені повторювані ітерації з використанням формули (Ії), щоб визначити, чи не можна ідентифікувати більшу хімічну детермінанту, що отримується внаслідок су
Комбінування або подальшого збільшення якого-небудь із цих восьми фрагментів. У найбільшої статистично значущої хімічної детермінанти, виявленої в ході цих додаткових обчислень, молекулярна маса була 335Да, і о вона була вибрана як представницький каркас, або фармакологічно активний фінгерпринт для подальшого вибору і синтезу сполук. Третій етап процесу включав використання описаного вище представницького каркаса як шаблона для віртуального скринінгу і вибору сполук. Для цієї мети були проведені пошуки за підструктурою в «- базі даних, яка містила більш 600000 доступних на ринку сполук, із використанням як обчисленого фінгерпринта, так ії його фрагментів. На основі цих пошуків були придбані 1360 сполук, і ще 1280 сполук були вибрані о випадково і придбані від тих же постачальників для контрольних цілей. с
Четвертий і п'ятий етапи, що представляли кінцеві фази процесу, проводилися паралельно. Четвертий етап включав перевірку множин сполук, описаних вище, шляхом проведення досліджування зв'язування міченими б лігандами. Із 1360 молекул, відібраних на основі представницького каркаса, 205 молекул демонстрували прийнятну активність при застосуванні в рамках досліджування в концентраціях 1-10мМкМ, 21 сполука демонструвала активність в концентраціях 0,1-1мкМ, і одна сполука, названа сполукою А, виявила спорідненість до рецептора (Кі) 8,1-41,058М (п-12). Жодна з 1280 випадково вибраних сполук не продемонструвала « властивостей зв'язування рецептора при перевірці в концентрації 1ОмкМ. Як така, множина сполук, складена на основі представницького фінгерпринта, була щонайменше в 21 раз ефективнішою (за часткою активних /щ- с молекул), ніж множина випадкових сполук (р«е0,0001). ч Як було виявлено, сполука А представляла новий до того невідомий клас інгібіторів рецептора, що ,» представляє інтерес. Фіг.12 ілюструє вплив сполуки А на опосередковане рецептором продукування інозиттрифосфату. Представляючі рецептор, що представляє інтерес, клітини, в які був заздалегідь введений інозит з радіоактивною міткою, були піддані дії антагоніста рецептора в присутності сполуки А, з різними - І концентраціями. Продукування інозиттрифосфату (ІР 3) вимірювалося після елюювання мічених радіоізотопами клітинних інозитолфосфатів із колонки для визначення спорідненості. Сполука А інгібувала спричинене шо антагоністом утворення ІР з з ІСвбо-22нМ, значенням, яке відповідає спорідненості цієї сполуки до даного ко рецептора.
Як показано на Фіг.12, сполука А значно знижувала рецептор-опосередковане продукування о інозиттрифосфату в клітинному функціональному дослідженні (ІСво-22нМ), результат, який відповідає як - спорідненості цієї сполуки до даного рецептора, так і використанню антагоністів рецептора в описаних вище обчисленнях. Нарешті, сполука А було визначена як така, що харакетризується високою селективністю дію на рецептор, що представляє інтерес, оскільки вона не продемонструвала істотної інгібувальної активності в
Концентрації ТОмМкМ при випробуваннях в більш ніж 20 інших дослідженнях зв'язування рецептора з використанням мічених радіоізотопами лігандів. о П'ятий етап полягав у використанні описаного вище представницького каркаса для концептуального ко конструювання і синтезу нових (в значенні складу речовини) хімічних сполук, з метою ідентифікації нових молекул із властивостями зв'язування рецептора. Для цього був складений перелік хімічних реагентів і 60 продуктів реакцій, в якому описаний вище біологічно активний представницький каркас або його фрагменти містилися або в хімічних структурах цих реагентів, або в одержуваному в результаті продукті (продуктах) реакції. Були відібрані більш ніж 2000 комбінацій реагентів, і для випробувань були синтезовані відповідні продукти реакцій. Перевірка цих сполук при досліджуванні зв'язування рецептора дозволила ідентифікувати новий клас хімічних сполук (в значенні складу речовини), ряд представників якого демонстрував ІС во в 65 діапазоні 50-БООНМ.
Приклад Мо2 - Ефективна ідентифікація нових і селективно діючих інгібіторів кінази
Був розроблений ферментативний метод аналізу для людської кінази, що бере участь в запальному процесі, інгібітори якої раніше не описувалися в літературі. Для перевірки за цим методом досліджень була зібрана колекція сполук, і способом, запропонованим згідно з цим винаходом, в ході цієї перевірки були ідентифіковані
Нові інгібітори кінази. Перший етап полягав в складанні списку з 2367 хімічних структур інгібіторів білків, що зв'язують пуриновий нуклеотид, відомих з наукової літератури, який включає, в тому числі, структури сполук, які, як було вже відомо, інгібують інші кінази, фосфодіестерази, рецептори, що зв'язують пуриновий нуклеотид, і іонні канали, модульовані пуриновим нуклеотидом, що далі іменуються "мішенями-сурогатами".
Другий етап полягав в ідентифікації біологічно активних хімічних детермінант, що містяться у цих 2367 7/0 Хімічних структурах. Для цієї мети був створений і доданий до першого додатковий список, що містив 98971 структур, які раніше описувалися в літературі як такі, що не впливають на ці мішені-сурогати. Одержаний список з 101338 структур був проаналізований на присутність біологічно активних хімічних детермінант шляхом вибору пропорційної міри асоціації (ІП), де х - кількість активних хімічних структур, що містять хімічну детермінанту, що становить інтерес, у - загальна кількість хімічних структур, що містять цю ж хімічну /5 детермінанту, 2 - загальна кількість активних хімічних структур в множині М молекул (тобто 2-2367), і М - загальна кількість хімічних структур, що досліджуються (тобто М-101338). ім у-а жк) (Ф-хму-х)
На основі міри асоціації (І) була побудована рейтингова функція (ІМ), в якій фахівець упізнає спосіб оцінки значення нижньої межі 9590 довірчого інтервалу міри (ІІ), шляхом використання логарифмічного перетворення, щоб зробити розподіл співвідношення більш порівнянним із таким нормального розподілу, і першого порядку апроксимацію рядів Тейлора для оцінки дисперсії логарифма цього співвідношення. У цьому прикладі в рейтинговій функції не використовувалися ніякі інші змінні, крім х, у, 2 або М, хоч фахівцеві буде с 29 зрозуміло, що формулу (ІМ) можна було б перетворити до такого вигляду, щоб вона включала додаткові змінні, (9 пов'язані з речовинними, біологічними, хімічними і/або фізико-хімічними властивостями молекул, як згадувалося в прикладі Мо1 (але не обмежуючись лише ними). Фахівцеві буде також зрозуміло, що для тієї ж мети замість описаних в формулах (І) і (ІМ) можна використати інші міри асоціації і/або рейтингові функції, найбільш придатні з яких, для цілей даного винаходу, включають різні поєднання двох, трьох або чотирьох змінних: х, у, - ім. со ин щМ-у-гх) вок ду.хі аск усаху сч (2-хду-х) Ф
Зо Аналіз цих 101338 хімічних структур, описаних як такі, що мають різну біологічну активність, виконувався ї- шляхом визначення рейтингових значень для ряду хімічних детермінант за допомогою формули (ІМ), з визначенням однієї або кількох груп детермінант як таких, що містять елементи зі значенням більше одиниці, що відповідало імовірності зустрічання в цій підмножині біологічно активних структур лише завдяки чистому « випадку менш ніж 1 до 20 (р«0,05). Відповідно, ці хімічні детермінанти були визнані як такі, що представляють один або декілька фармакологічно активних компонентів інгібіторів мішеней-сурогатів, описаних З с в літературі, і були зібрані в четвертий список. На відміну від пошуку таких поєднань цих детермінант, які "» мають максимальні рейтингові значення, як було описано в прикладі Мої, ці структури були безпосередньо " використані як представницькі каркаси, або фармакологічно активні фінгерпринти, для подальшого вибору і синтезу сполук.
Третій етап включав використання описаного вище представницького каркаса як шаблону для віртуального ш- скринінгу і вибору сполук. Для цієї мети були проведені пошуки підструктур в базі даних, що містила більше
Ге) 250000 комерційно доступних сполук, із використанням як обчислених фінгерпринтів, так і їх фрагментів і поєднань. На основі цих пошуків були придбані 2846 сполук, а для контрольних цілей була використана колекція ко з 1280 випадково вибраних сполук, описана в прикладі Мо1. 2) 20 Четвертий і п'ятий етапи, що представляють кінцеві фази процесу, проводилися паралельно. Четвертий етап включав перевірку придбаних сполук ферментативним методом аналізу. Із 2846 молекул, відібраних за -6ь представницьким каркасом, 88 продемонстрували інгібіторну активність при випробуванні в концентрації бмкМ.
Серед них шість молекул показали ІСсо в межах 0,-2мМкМ, а одна сполука, названа сполукою В, продемонструвала ІСсо-164нМ (Фіг.13).
Фіг.13 ілюструє вплив сполуки В на кіназо-залежне фосфорилування білка. Кіназа, що становить інтерес,
ГФ) інкубувалася з міченим радіоактивними ізотопами АТФ і пептидним субстратом в присутності зростаючих концентрацій сполуки В. Фосфорилування білка вимірювалося стандартними радіометричними методами. де Сполука В істотно інгібує кіназо-залежне фосфоритування білкового субстрату, демонструючи ІСво-164нМ.
Серед перевірених в контрольних цілях 1280 випадково відібраних структур тільки три продемонстрували 60 інгібіторну активність при скринінгу, причому найбільш сильнодіюча показала ІСво всього 7,8МкМ. Як така, множина сполук, складена на основі представницьких фінгерпринтів, була в 13,2 рази більш багатою" на активні молекули, ніж множина випадково вибраних сполук (р«е0,0001). Більш того було виявлено, що сполука В представляє новий клас АТФ-конкурентного інгібітору кінази, про який досі не повідомлялося, що при дослідженні селективності із використанням як структурно, так і функціонально споріднених інших кіназ бо демонструє селективну дію на кіназу, що становить інтерес, із 250-кратною селективністю.
П'ятий етап полягав у використанні одного або кількох згаданих представницьких каркасів, щоб задати напрям (в тому, що стосується складу речовини) конструювання і синтезу нових хімічних сполук для виявлення нових молекул із кіназо-інгібіторною активністю. Для цієї мети був складений список хімічних реагентів і продуктів реакцій, в якому описані вище біологічно активні представницькі каркаси або їхні фрагменти містилися або в хімічних структурах реагентів, або в продукті (продуктах) реакції що одержуються в результаті реакції. Було відібрано більше ніж 4000 поєднань реагентів, і для випробувань були синтезовані відповідні продукти реакцій. Перевірка цих сполук методами скрінінгу призвела до ідентифікації двох нових класів хімічних сполук, в тому, що стосується складу речовини, ряд представників якого демонстрували ІС во в 70 діапазоні 100-БООНМ.
Приклад МоЗ3 - Ефективна ідентифікація нових і селективно діючих блокаторів іонних каналів
Було проведено дослідження для іонного каналу, який, як вважають, відіграє певну роль в дегенерації нервових волокон, для якої в літературі раніше не описувалося ніяких інгібіторів. Для перевірки в рамках цього дослідження була складена колекція сполук, і способом, запропонованим згідно з цим винаходом, в ході /5 Чієї перевірки були ідентифіковані нові інгібітори. Перший етап полягав в збиранні необхідних структурних даних для ідентифікації хімічних детермінант інгібіторів каналу, що становить інтерес. Це було здійснено перевіркою перших 3680 сполук із колекції нашої компанії при концентрації МКМ шляхом скринінгу, з встановленням інгібіторної активності кожної структури зі списку. При використанні як порога 40-відсоткового інгібування як активні були ідентифіковані 36 структур, а інші 3644 сполук були кваліфіковані як неактивні.
Другий етап полягав в ідентифікації біологічно активних хімічних детермінант в структурах цих 36 інгібіторів. Для цієї мети було проаналізовано згадані 3680 перевірених структур шляхом вибору вищезгаданої міри асоціації (І), де х - кількість активних хімічних структур, що містять хімічну детермінанту, що становить інтерес, у - загальна кількість хімічних структур, що містять цю ж хімічну детермінанту, 7 - загальна кількість активних хімічних структур в множині з М молекул (тобто 2-36), і М - загальна кількість сч підданих аналізу хімічних структур (тобто М-3680). Потім на основі міри асоціації (І) була побудована рейтингова функція (М), в якій фахівець упізнає коефіцієнт кореляції добутку моментів, що відображає ступінь і) розподіленої між двома дихотомічними змінними дисперсії, явно не показаної в формулі (М). (М) Рейтинг - - .
Ми - уг - зо уг(м-2укм-У) с
У цьому прикладі в рейтинговій функції не використовувалися ніякі додаткові змінні, крім х, у, 2 або М, сч хоч, як буде зрозуміло фахівцеві, рейтингову функцію (М) можна було б перетворювати до такого вигляду, щоб вона включала додаткові змінні, зв'язані з речовинними, біологічними, хімічними і/або фізико-хімічними (22) з5 властивостями молекул, як згадувалося в прикладі Мої (але не обмежуючись цим). Фахівцеві буде також чн зрозуміло, що замість описаних в формулах (І) і (М) для цієї ж мети можна використати інші міри асоціації іабо рейтингові функції, особливо тому, що рейтингова функція (М) не інваріантна до різних змін в схемі проведення досліджень і/або розподілів у, (М-у), 2 і (М-2). Для цілей цього винаходу найбільш придатні з цих інших способів включають різні поєднання двох, трьох або чотирьох змінних, у, 2 і М. « 20 Нижче показані приклади хімічних детермінант, використаних для аналізу і відібраних для подальшої ш-в перевірки. 3680 структур, перевірених на активність щодо інгібування каналів, були перевірені на наявність с біологічно активних підструктур із використанням групи хімічних детермінант, що включає п'ять, показаних в :з» секції А. Серед цих п'яти структур, детермінанта Мо4 продемонструвала найвище рейтингове значення, що вказує на те, що імовірність того, що вона лежить в основі активності з інгібування каналів, була найвищою.
Відповідно, обчислення були повторені для структур, що містять детермінанту Мо4, і хімічна структура, показана -І в секції В, була визначена як одна з найбільших статистично значущих детермінант, що містяться в групі з 36 інгібіторів. Отже, вона була вибрана для подальшої перевірки. Позначення: А - С, М, О або 5; В - Н або ОН. се) . з. б е с 50
Зо омннляа нн вили | (ул
Су Су о не шй ко Райт й Кіт «й
Аналіз цих 3680 перевірених структур проводився шляхом визначення рейтингових значень для ряду хімічних 60 детермінант з використанням формули (М) і відбирання структур, що дають найбільші ненульові додатні значення. Приклади деяких з хімічних детермінант, використаних в цьому процесі, показані в секції А, разом з їхніми обчисленими рейтинговими значеннями. Серед них детермінанта Мо4 має найбільше рейтингове значення; за оцінкою, імовірність зустрічання цієї детермінанти в підмножині структур, що блокують канал, завдяки чистому випадку є меншою, ніж 1:100 (р «0,01). Відповідно, детермінанта Мо4 була визнана бо представником біологічно активного компонента багатьох з цих 36 інгібіторів. Після цього обчислення з використанням формули (М) були повторені, щоб визначити, чи не можна ідентифікувати ще більші хімічні детермінанти. Найбільша статистично значуща детермінанта виявлена в ході цих додаткових обчислень, показана в секції В. Ця структура була відібрана як представницький каркас, або фармакологічно активний
Фінгерпринт, для подальшого вибору і синтезу сполук.
Третій етап включав використання згаданого представницького каркаса, показаного в секції В, як шаблона для віртуального скринінгу і вибору сполук. Для цієї мети були проведені пошуки за підструктурами в базі даних, що містить понад 400000 комерційно доступних сполук, із використанням для цієї мети як згаданого обчисленого фінгерпринта, так і його фрагментів. По результатах цих пошуків відібрали загалом 1760 сполук; 7/0 для контрольних цілей використовувалася колекція з 1280 випадково відібраних сполук, описана в прикладі Мо1.
Четвертий і п'ятий етапи, що представляють кінцеві фази процесу, проводилися паралельно. Четвертий етап включав перевірку придбаних сполук у ферментативному досліді. З 1760 молекул, відібраних на основі представницького каркаса, 84 продемонстрували інгібіторну активність 8095 або більше при випробуванні в концентрації бмкМ. Серед них 8 молекул показали наномолярне ІС бо, а одна сполука, названа сполукою С, 7/5 продемонструвала ІСво-400нМ. Два приклади цих інгібуючих канали сполук показані нижче; обидві в точності містять фармакологічно активний фінгерпринт, показаний в секції В. " -
КЕ
«Коли "'юЮю ши Е
Е а
І с т - "жо от " че є І вн о)
М но поь - бат со
Ці дві інгібуючі канали сполуки були відібрані для перевірки з використанням способу, запропонованого с згідно з цим винаходом. Обидві молекули істотною мірою інгібували відповідний канал. Хімічні структури цих Ге! двох сполук містять фармакологічно активну хімічну детермінанту, ідентифіковану з використанням способу,
Зо запропонованого згідно з цим винаходом, і показану в секції В вище (див. фрагменти структури, показані ї- жирними лініями).
З 1280 випадково вибраних сполук, перевірених для контрольних цілей, за результатами скринінгу лише 33 молекули продемонстрували інгібіторну активність 4095 або більше. Як така, множина сполук, складена на основі « представницького фінгерпринта, показаного в секції В, була в 1,8 рази багатшою" на активні молекули, ніж множина, складена з випадково вибраних сполук (р«0,005). Множина сполук, складена на основі показаного в в) с секції В фінгерпринта, була в 4,9 рази багатшою" на активні молекули, ніж перші 3690 сполук із колекції "» сполук нашої компанії (р«е0,0001). " П'ятий етап полягав у використанні показаного в секції В представницького каркаса для того, щоб задати напрям розробки і синтезу нових (за складом речовини) хімічних сполук, для ідентифікації нових молекул із канал-інгібувальними властивостями. Для цього один зі 120 описаних вище фармакологічно активних інгібіторів ш- був відібраний для подальшої перевірки, і був хімічно модифікований із використанням раніше зібраних
Ге) позитивних і негативних результатів скринінгу - як джерела інформації про активність структур. Ця робота призвела до синтезу і подальшої ідентифікації нового (за складом речовини) і до цього не описаного класу о блокатора іонних каналів, ряд представників якого демонстрували ІС 5о в діапазоні 100-БООНМ. Перевірка на 2) 20 селективність засвідчила, що ця сполука була селективною щодо відповідного каналу порівняно до 30 інших мішеней для лікарських засобів, і, крім того сповільнювала загибель клітин в моделі апоптозу, зумовленого -6ь дефіцитом фактора росту нервових клітин.
Приклад Мо4 - Ефективна ідентифікація нових і селективно діючих інгібіторів протеази
Були проведені дослідження ферментативним методом аналізу для протеази, яка, як вважають, відіграє 229 ключову роль в ішемічному ураженні і пошкодженні. Протеаза, що розглядається, була членом сімейства
ГФ) споріднених ферментів, і була єдиною мішенню для терапевтичного впливу, що становила інтерес. Для перевірки в цьому дослідженні була складена колекція сполук і способом, запропонованим згідно з цим де винаходом, в ході цієї перевірки були ідентифіковані нові інгібітори ферменту. Перший етап полягав у збиранні структурних даних, необхідних для ідентифікації хімічних детермінант інгібіторів цього ферменту. Це було 60 здійснене за допомогою скринінгу 1680 сполук при концентрації ЗмкМ з встановленням інгібіторної активності для кожної сполуки. При використанні порога інгібіторної активності у 4095 активними було визнано 17 структур, а інші 1663 молекул були визнані неактивними.
Другий етап полягав в ідентифікації біологічно активних хімічних детермінант, що містяться в структурах згаданих 17 інгібіторів. Для цього 1680 перевірених структур були опрацьовані із використанням змішаної міри бо асоціації (МІ) (див. нижче), де х - кількість активних хімічних структур, що містять хімічну детермінанту, що становить інтерес, у - загальна кількість хімічних структур, що містять цю ж хімічну детермінанту, 7 - загальна кількість активних хімічних структур в множині з М молекул (тобто 2-17), і М - загальна кількість хімічних структур, що опрацьовувалися (тобто М-1680). У цьому випадку міра асоціації (МІ) безпосередньо
Використовувалася як рейтингова функція для ідентифікації біологічно активних хімічних детермінант, що містяться у згаданих 17 інгібіторах. (М) х у 2 Мн
У цьому випадку в рейтинговій функції не використовувалися ніякі додаткові змінні, крім х, У, 2 або М.
Але, як буде зрозуміло фахівцеві, рейтингову функцію (МІ) можна було б перетворити до такого вигляду, щоб вона включала додаткові змінні, що відносяться до речовинних, біологічних, хімічних і/або фізико-хімічних властивостей молекули, як згадувалося в прикладі Мо1 (але не виключно цих властивостей).
Фахівцеві буде також зрозуміло, що замість формули (МІ) для цієї ж мети можна використати інші міри асоціації і/або рейтингові функції, особливо оскільки безпосереднє використання цієї міри асоціації дозволяє лише відносну оцінку імовірності того, що певна хімічна детермінанта лежить в основі біологічної активності.
Найбільш придатні з таких альтернативних способів, для цілей цього винаходу, включають різні поєднання двох, трьох або чотирьох змінних х, у, 2 і М.
Аналіз згаданих 1680 перевірених структур проводили шляхом визначення рейтингових значень для ряду хімічних детермінант за допомогою формули (МІ) і відбору структур, що дають найбільші додатні значення.
Приклади декількох з хімічних детермінант, використаних в цьому процесі, показані в секції А, разом з обчисленими для них рейтинговими значеннями. Серед них детермінанти Мо7 і Мо8 мали найбільші рейтингові значення, і вони були визнані такими, що представляють одну або кілька біологічно активних компонентів значної кількості зі згаданих 17 інгібіторів. Потім були повторені обчислення з використанням формули (МІ), с щоб визначити, чи не можна ідентифікувати ще більші хімічні детермінанти; це не дало позитивного результату о для наявної колекції з 17 структур, і детермінанти Мо7 і Мо8 були поєднані для утворення представницького каркаса, або фармакологічно активного фінгерпринта, для подальшого вибору і синтезу сполук.
А в - со
Омнцлий сч т. поданий Ф п | я м- най Но Но. г но.
Фойжииг т В ЗБІЙ зе ФФБ Рейтн я ОКУ фей ш КЕ « т0 В цих секціях (вище) показані приклади хімічних детермінант, використаних для аналізу і відібраних для 8 с подальшої перевірки. Загалом 1680 структур, перевірених на активність щодо інгібування протеази, були з» перевірені на присутність біологічно активних підструктур із використанням множини хімічних детермінант, що включає чотири детермінанти, зображені в секції А. З цих чотирьох структур детермінанти Мо7 і Мо8 мали найбільші рейтингові значення, що вказують на найвищу імовірність того, що саме вони лежать в основі 75 активності з інгібування протеази. Для порівняння, у детермінанти, що складалася з простого бензольного і кільця, був рейтинг 0,02. Оскільки при повторенні обчислень із детермінантами Мо7 і Мо8 не було отримано (Се) структур із більшими рейтингами, ці дві структури були поєднані в хімічну структуру, показану в секції В, яка й була використана як представницький каркас, або фармакологічно активний фінгерпринт, для віртуального о скринінгу і вибору сполук. Позначення: А - С або 5; В - Н, С, М, О або атом будь-якого галоїду. о 250 Третій етап включав використання згаданого представницького каркаса, показаного в секції В, як шаблона для віртуального скринінгу і вибору сполук. Для цього були проведені пошуки за подструктурами в базі даних, та що містить понад 150000 комерційно доступних сполук, із використанням для цієї мети як згаданого одержаного фінгерпринта, так і його фрагментів. На основі цих пошуків було відібрано в загальній кількості 589 сполук.
Четвертий і п'ятий етап процесу включали перевірку відібраних сполук ферментативним методом аналізу. З 25 589 відібраних на основі згаданого представницького каркаса сполук 52 молекули продемонстрували інгібіторну
ГФ) активність 4095 або більше при перевірці згаданим методом аналізу при концентрації ЗмкМ. Серед них 12 сполук показали наномолярний ІСрво, і одна сполука, названа сполукою 0, мала ІСво-б5нНМ. Нижче показані шість з цих о інгібуючих протеазу молекул; всі вони мають щонайменше один фармакологічно активний фінгерпринт, показаний в секції В. 60 б5
-
СО0О ої
Кк б В
Фо і рез з ї о мод, й з «Ду о) іх е - со
Ці шість інгібуючих протеазу сполук були відібрані для перевірки з використанням способу, запропонованого згідно з цим винаходом. Кожна молекула значною мірою інгібувала білок, що представляє інтерес, демонструючи см
ІСво в діапазоні 0,15-15мкМ. Як показано виділеними чорним подструктурами, структури кожної з цих шести Ф) сполук містять ідентифіковану способом цього винаходу і показану вище в панелі В фармакологічно активну хімічну детермінанту. Певні з цих сполук фактично містять більше за один варіант згаданого фінгерпринта, - наприклад, тетрациклічна структура, показана вище в нижньому правому кутку.
Як така, множина сполук, складена на основі показаного в панелі В представницького фінгерпринта, була в 8,7 рази ефективніше в доставці активних молекул, ніж спочатку перевірена колекція з 1680 сполук (р0,0001). « дю Більш того було виявлено, що 52 раціонально ідентифікованих сполук виявляли селективну дію на протеазу, що з представляє інтерес, в той час як більшість (29090) не демонстрували інгібіторної активності при випробуванні с при концентрації бмкМ на спорідненій протеазі, що належить до того ж сімейства ферментів, а також при :з» випробуванні за таких само умов на 12 інших мішенях лікарських засобів.
Приклад Мо5 - Раціональна ідентифікація нових і селективно діючих інгібіторів фосфатази
Був розроблений ферментативний метод аналізу для фосфатази, яка, як вважається, відіграє ключову роль в - 15 сенсибілізації і регуляції рецепторів. Для перевірки цим методом була зібрана колекція сполук, і способом, запропонованим згідно з цим винаходом, в ході цієї перевірки були ідентифіковані нові інгібітори ферменту. (Се) Перший етап полягав в збиранні необхідних структурних даних для ідентифікації хімічних детермінант т інгібіторів даного ферменту. Це було здійснено перевіркою перших 12160 сполук із нашої корпоративної колекції при концентрації ЗмкМ скринінгом з анотуванням |інгібіторної активності для кожної хімічної структури. При (95) 50 використанні як іонний поріг 50-процентного інгібування як активні були ідентифіковані 15 хімічних структур, щк а інші 12145 молекул були кваліфіковані як неактивні.
Другий етап полягав в ідентифікації біологічно активних хімічних детермінант, що містяться в структурах цих 15 інгібіторів. Для цієї мети були проаналізовані 12160 анотованих структур із використанням змішаної міри асоціації (МІЇ), де х представляв кількість активних хімічних структур, що містять цікавлячу хімічну детермінанту, у представляв загальну кількість хімічних структур, що містять цю ж хімічну детермінанту, 7
ГФ) представляв загальну кількість активних хімічних структур в множині М молекул (тобто 2-15), і М представляв 7 загальну кількість підданих аналізу хімічних структур (тобто М-12145). (МІ) б2)-(2-Х)(М-2)
Потім з міри асоціації (МІ) була виведена рейтингова функція (МІ), яку фахівець в цій галузі упізнає бо як таку, що відноситься до оцінки відносного ризику з використанням нахилу лінії регресії, що представляє ступінь розподіленої між двома дихотомічними змінними дисперсії, яка була перетворена для урахування молекулярної маси (ММУ) кожної хімічної детермінанти, що розглядається. (МИ) Оцінка - МУУ. еібулуаюкмМ а, 65 У цьому контексті в рейтинговій функції не використовувалися ніякі додаткові змінні, крім х, у, 72, М або
ММУ, хоч, як очевидно фахівцеві в цій галузі, рейтингову функцію (МІ) можна було б перетворити до такого вигляду, щоб вона включала додаткові змінні, що відносяться до речовинних, біологічних, хімічних і/або фізико-хімічних властивостей молекули, як згадувалося в прикладі Мо1, але не виключно. Фахівцеві в цій галузі буде також очевидно, що, замість описаної в формулі (МІІЇ), для цієї ж мети можна використати інші міри асоціації мМабо рейтингові функції, особливо оскільки порівняння нахилів в певних випадках може не забезпечувати достатньої дискримінації між двома близькоспорідненими хімічними детермінантами. Найбільш придатні з таких оцінних функцій, в значенні цього винаходу, включають різні поєднання двох, трьох або чотирьох змінних х, у, 2 і М.
Аналіз цих 12160 анотованих структур виконувався шляхом визначення рейтингових значень для ряду 7/0 Хімічних детермінант за допомогою формули (МІ) і збереження структур, що дають найбільші додатні значення.
Це призвело до ідентифікації трьох різних хімічних детермінант із молекулярною масою в діапазоні 120-220Да і імовірністю з'явлення в цій підмножині активних хімічних структур лише завдяки чистому випадку менш ніж 1 на 1Ф(р«0,1). Відповідно, ці три хімічні детермінанти були прийняті як такі, що представляють одну або кілька фармакологічно активних субодиниць 15 інгібіторів ферменту, ідентифіковані внаслідок скринінгу, і були зібрані в четвертий список. Потім були повторені обчислення за допомогою формули (МІ), щоб визначити, чи не можна ідентифікувати більшу хімічну детермінанту, що отримується внаслідок поєднання цих трьох фрагментів, або подальшого розширення якого-небудь із цих трьох фрагментів. Найбільша, статистично значуща хімічна детермінанта, виявлена в ході цих додаткових обчислень, мала молекулярну масу 255Да, і була відібрана як представницький каркас, або фармакологічно активний фінгерпринт для подальшого вибору сполук.
Третій етап включав використання описаного вище представницького каркаса як шаблон для віртуального скринінгу і відбору сполук. Для цієї мети були проведені пошуки подструктур в базі даних, що містить понад 800000 комерційних і приватних сполук, із використанням для цієї мети як згаданого обчисленого фінгерпринта, так і його фрагментів. На основі цих пошуків було придбано в загальній кількості 1242 сполук, а для контрольних цілей використовувалася колекція з 1280 випадково відібраних сполук, описана в прикладі Мо1. с
Четвертий і п'ятий етапи процесу включали перевірку цих сполук ферментативним методом аналізу. Із 1242 відібраних на основі згаданого представницького каркаса сполук 34 молекули продемонстрували щонайменше і) 50-процентну інгібіторну активність при перевірці згаданим методом при концентрації ЗмкМ. Серед них вісім сполук продемонстрували ІСсо в субмікромолярному діапазоні а одна сполука, названа сполукою Е, продемонструвала ІСсо-87нМ (Фіг.14). «- зо Фіг.14 ілюструє дію сполуки Е на фосфатазо-залежне дефосфорилування білка. Цікавляча фосфатаза була інкубована на живильному середовищі, що містило фосфорилований пептид в присутності зростаючих ме) концентрацій сполуки Е. Дефосфорилування живильного середовища аналізувалося шляхом вимірювання с виділення вільного фосфату в реакційному середовищі з малахітовим зеленим. Сполука Е значно інгібувала фосфатазо-залежне дефосфорилування, демонструючи ІСво-87нМ. Ме
Серед 1280 випадково вибраних сполук, що перевіряються для контрольних цілей, тільки дві показали М інгібіторну активність при скринінгу, найбільш сильнодіюча з яких продемонструвало ІС во всього 1,8МкМ. Як така, ця множина, складена на основі представницьких фінгерпринтів, була в 17,5 рази ефективніше в доставці активних молекул, ніж множина, складена з випадково вибраних сполук (р«е0,0005), і в 22,3 рази ефективніше, ніж перші 12160 сполук із корпоративної колекції сполук (р«0,00001). «
Нарешті, було виявлено, що сполука Е представляє новий клас інгібіторів фосфатази, про який до цього не з с повідомлялося, демонструючи більш ніж в 20 разів перевищуючу селективність відносно цікавлячої мішені при перевірці в пробах на селективність із використанням як структурно, так і функціонально споріднених ;» альтернативних фосфатаз.
Приклад Моб - Підвищення дієвості хімічного ряду
Цей винахід також може бути використаний для підвищення дієвості хімічного ряду. Для підтвердження цього -І прикладами була перевірена колекція із 1251 сполук при концентрації ЗмкМ в протеазній пробі, яка дала 25 сполук, що демонструють щонайменше 4095 інгібіторну активність. Аналіз цих структур був проведений як і, описано в прикладі Мо1, що призвело до ідентифікації ряду хімічних детермінант, імовірність з'явлення серед 7 ко з 25 інгібіторів протеази лише завдяки чистому випадку у однієї з яких була менше за 1 на 100000 (р «0,0001).
На жаль, сім сполук, що містять цю детермінанту, продемонстрували лише помірну інгібіторну активність о (середнє ІСво-3,4мМкМ--1,34мМкМ, п-7), що зробило їх непривабливими для подальшої хімічної перевірки. Як - М наслідок, дана детермінанта була прийнята як така, що представляє біологічно активну субодиницю цікавлячих інгібіторів і безпосередньо використана як представницький каркас, або фармакологічно активний фінгерпринт, для додаткового відбору сполук.
Для цієї мети була піддана скринінгу по детермінанті, що представляє інтерес, база даних із більше ніж 100000 комерційно доступних молекул, а для додаткової перевірки були відібрані 142 молекули. Серед цих 142 іФ) сполук 11 показали інгібіторну активність в субмікромолярному діапазоні, демонструючи середнє ко ІСво-0,48мкМ--0,09мМкМ (п-11, середнє ІСво значно менше, ніж попереднє значення при р 0,05). Як такий, спосіб, запропонований згідно з цим винаходом, дозволяє значно підвищити фармакологічну дієвість хімічного бо ряду.
Приклад Мо7 - Підвищення селективності хімічного ряду
Цей винахід також може бути використаний для підвищення селективності хімічного ряду. Для підтвердження цього прикладами була перевірена колекція із 3360 сполук при концентрації ЗмкМ в кіназній пробі, названій кіназною пробою Мо1, яка дала 22 сполуки, що демонструють щонайменше 4095 інгібіторну активність. Аналіз цих 65 структур був проведений як описано в прикладі Мо2, що призвело до ідентифікації ряду хімічних детермінант, одна з яких, названа "детермінанта Мо10", була оцінена як така, що має імовірність з'явлення серед З з 22 інгібіторів кінази лише завдяки чистому випадку менш ніж 1 на 20(р «0,05). На жаль, тести селективності, проведені на чотирьох інших кіназах, виявили, що детермінанта Мо10 була також важливою складовою інгібіторів іншої кінази, названої кіназою Мо2, вказуючи на те, що селективно діючі інгібітори кінази Мо1 не можна створити на основі лише детермінанти Ме10. Більш того ці три структури, що містять детермінанту Ме10, були однаково діючі на цих двох кіназах, демонструючи середнє ІСво-7,2мМкМ--3,81мкМ (п-3), і, відповідно, 21,5мкМ-9,29мкМ (п-3) на кіназах Мо1 і Мо2, що представляло коефіцієнт селективності, рівний лише 2,98, на користь кінази Мо1.
З огляду на це, 3360 сполук, що перевірялися на кіназі Мої, були перевірені при концентрації ЗмкМ на кіназі Мо2, що дало 92 сполуки, що демонструють щонайменше 40905 інгібувальну активність. Потім був 7/0 анотований за активностями кінази Мої і кінази Мо2 список із 3360 структур, і проведений аналіз способом, запропонованим згідно з цим винаходом, із вибором міри асоціації (І) і виведенням із неї рейтингової функції (ІХ), де Хі представляв кількість активних на кіназі Мої хімічних структур, що містять цікавлячу хімічну детермінанту, Хо представляв кількість активних на кіназі Мо2 хімічних структур, що містять цю ж хімічну детермінанту, у представляв загальну кількість хімічних структур, що містять цю хімічну детермінанту, 74 7/5 представляв загальну кількість активних на кіназі Ме1 хімічних структур в множині М молекул (тобто 21-22), 722 представляв загальну кількість активних на кіназі Мо2 хімічних структур у множині М молекул (тобто 25-92), і М представляв загальну кількість підданих аналізу хімічних структур (тобто М-3360).
З хуМм-у-гіжхі го -хому- хо): хобі у жо хо - ху - ху
Фахівець в цій галузі побачить в рейтинговій функції (ІХ) спосіб порівняння відносних ризиків, що дозволяє ідентифікувати хімічні детермінанти з найбільшою імовірністю селективної дії на одну кіназу замість певної іншої. У цьому контексті фахівцеві очевидно, що формулу (ІХ) можна було б перетворити до такого вигляду, щоб вона включала додаткові змінні, що відносяться до речовинних, біологічних, хімічних і/або сч фізико-хімічних властивостей молекули, як згадувалося в прикладі Мої, але не виключно. Нарешті, також Ге) очевидно, що замість описаних в формулах (ІІІ) і (ІХ) для цієї ж мети можна використати інші міри асоціації іабо рейтингові функції. Наприклад, в рейтинговій функції (ІІ) можна було б використати міру асоціації (І), і отримані для активності кінази Мо2 рейтингові значення можна було б відняти з отриманих для активності кінази Мо1, або, навпаки, значення, отримані для активності кінази Мо1, можна було б розділити на отримані для -- кінази Мо2. Можливі також багато які інші підходи, найбільш придатні з яких, в значенні цього винаходу, со використовують рейтингові функції, що включають різні поєднання двох, трьох із чотирьох змінних х, у, 2 і М.
Визначення рейтингових значень для ряду хімічних детермінант за допомогою формули (ІХ) призвело до сч ідентифікації ряду селективно діючих на кіназу Мо1 хімічних детермінант, одна з яких, названа "детермінанта б
Мо11", складалася з детермінанти Мо10 із підстановкою додаткового хімічного елемента. Як наслідок, детермінанта Мо11 була прийнята як представляюча фармакологічно активну субодиницю селективно діючих - інгібіторів кінази Мо1 і була використана як представницький каркас, або фармакологічно активний фінгерпринт, для подальшого відбору сполук. Для цієї мети були проведені пошуки подструктур в базі даних із понад 400000 комерційно доступних сполук із використанням детермінанти Мо11 і її фрагментів. На основі цих пошуків було « придбано в загальній кількості 498 сполук, які, після перевірки в двох пробах, дали три інгібітори, що -о 70 містять детермінанту Мо10 і які демонстрували середню ІС 50-0,94мМкМ--0,52мкМ (п-З3) ії 31,бмкМ--4,41МмМкМ (п-З) с відповідно в кіназних пробах Мої і Мо2. Цей результат представляє 11-кратне збільшення коефіцієнта :з» селективності ряду для кінази Мо1 в порівнянні з кіназою Мо2 (з 2,98 до 33,6, р «9,05), демонструючи, що спосіб, запропонований згідно з цим винаходом, дозволяє збільшувати фармакологічну селективність цікавлячого хімічного ряду. -1 35 Приклад Мо8 - Раціональна ідентифікація ряду з множинними фармакологічними ефектами
Була розроблена функціональна проба для іонного каналу, що відкривається лігандами, який, як вважається, (Се) відіграє певну роль в імунній реакції. Для перевірки в цій пробі була зібрана колекція сполук, і способом, т запропонованим згідно з цим винаходом, в ході цієї перевірки були ідентифіковані нові інгібітори іонного каналу. Досліджуваний канал описувався як такий, що належить до сімейства мішеней, проникних для іонів (95) натрію, активованих пуриновими нуклеотидами, і інгібованих певними інгібіторами натрієвих каналів. З ще урахуванням вищесказаного було вирішено ідентифікувати фармакологічні фінгерпринти, що мають подвійну здатність копіювати пуринові нуклеотиди і одночасно інгібувати натрієві канали, з метою збільшення імовірності швидкої ідентифікації інгібіторів такого, що представляє інтерес, іонного каналу, що відкривається лігандами.
Перший етап полягав в складанні двох списків хімічних структур шляхом огляду поточної літератури. Перший
ГФ) список містив структури 79 документованих інгібіторів натрієвих каналів. Другий містив структури 2367
ГФ інгібіторів зв'язуючих пуринові нуклеотиди білків (деталі дивись в прикладі Мо2). Другий етап процесу полягав в ідентифікації біологічно активних хімічних детермінант, що одночасно містяться в обох списках хімічних структур. Для цього кожний список був доповнений структурами більш ніж 100000 молекул, що раніше 60 описуються як не діючі на мішень-замінник (мішені-замінники), що представляє (представляють) інтерес, і аналіз проводився шляхом вибору субтрактивної міри асоціації (І), як описано в прикладі МО, і виведення з неї рейтингової функції (Х), де хі представляв кількість хімічних структур, активних відносно натрієвих каналів і таких, що містять хімічну детермінанту, що представляє інтерес, х » представляв кількість хімічних структур, активних відносно зв'язуючих пуринові нуклеотиди білків і таких, що містять цю ж хімічну детермінанту, У 4 65 представляв загальну кількість структур, що містять цю хімічну детермінанту в списку структур з відміченими ефектами блокування натрієвих каналів, у» представляв загальну кількість структур, що містять цю хімічну детермінанту в списку структур із відміченим інгібуванням зв'язуючих пуринові нуклеотиди білків, 21 представляв загальну кількість структур, інгібуючих натрієві канали в множині Мі. молекул (тобто 71-79), 22 представляв
Загальну кількість хімічних структур, що впливають на зв'язуючі пуринові нуклеотиди білки в множині Мо молекул (тобто 22-2367), а М. і Мо представляли загальну кількість хімічних структур, підданих аналізу у відповідних списках анотованих структур. (Х) Оцінка - . меі-уєітм ,| (Мжа-ужама то іа | У хім - дм - 1 фам - хо )ма(Мо - узі
Фахівець в цій галузі пізнає в рейтинговій функції (Х) спосіб поєднання двох різних критеріїв асоціації, що дозволяє ідентифікувати хімічні детермінанти, які найвірогідніше впливають одночасно і на натрієві канали, і на зв'язуючі пуринові нуклеотиди білки. У цьому контексті фахівцеві очевидно, що формулу (Х) можна було б перетворити до такого вигляду, щоб вона включала додаткові змінні, що відносяться до речовинних, біологічних, хімічних і/або фізико-хімічних властивостей молекули, як згадувалося в прикладі Мо1, але не виключно. Також очевидно, що замість описаних в формулах (І) і (Х) для цієї ж мети можна використовувати інші міри асоціації іабо рейтингові функції, тим більше що рейтингова функція (Х) не враховує напрям відмінностей, існуючих в пропорціях вказаних двох наборів даних, неодмінно вимагаючи, щоб ці пропорції були сумісними, і, більш того щоб М. було сумісно з М», і щоб обидва значення були більшими ніж 20. Наприклад, можна зважити результати для наборів даних, в яких обсяги вибірок значно розрізнюються, шляхом використання рейтингової функції, базованої на зваженому середньому різниці між пропорціями (дивись приклад 21 нижче). Або можна було б включити в обчислення третю, четверту, або і-ту фармакологічну властивість, у разі чого стає очевидно, що формулу (Х) можна розширити в її більш загальну форму (Хі), де 4 представляє кількість списків сполук, що с 29 піддають аналізу, і де рейтингове значення, що отримується в результаті, можна безпосередньо співвіднестиз (3 таблицями стандартного нормального розподілу, для того щоб визначити імовірність виявлення однієї або кількох хімічних детермінант, що лежать в основі всіх фармакологічних властивостей, що розглядаються.
Можлива також безліч інших підходів, в найпридатніших з яких, в значенні цього винаходу, застосовуються рейтингові функції, що містять різні поєднання із двох, трьох із чотирьох змінних х, у, 2 і М. -- (ХІ) Оцінка - п ї . со
У | (мк -угум сч ча | уам-хуюм-у) | Ф ! - пи і -
Аналіз цих двох анотованих структур проводився шляхом визначення рейтингових значень для ряду хімічних детермінант за допомогою формули (Х) і збереження структур, що дають максимальні значення більше ніж 2. Це призвело до ідентифікації хімічної детермінанти, що має імовірність з'явлення в обох підмножинах біологічно активних структур лише завдяки чистому випадку менш ніж 1 до 2О0(р «0,05). Відповідно, ця хімічна « дю детермінанта, названа детермінантою Мо12, була прийнята як така, що представляє одну або кілька біологічних - активних субодиниць як інгібіторів натрієвих каналів, так і інгібіторів білків, зв'язуючих пуринові с нуклеотиди, і була безпосередньо використана як представницький каркас, або фармакологічно активний :з» фінгерпринт, для подальшого відбору сполук.
Третій етап процесу включав використання цього представницького каркаса як шаблон для віртуального сканування. Для цього були проведені пошуки підструктур в базі даних із більш ніж 250000 комерційно доступних - 15 сполук із використанням для цієї мети детермінанти Мо12 і її фрагментів. Внаслідок цих пошуків було виявлено 800 сполук, а для контрольних цілей була використана колекція з 1280 випадково відібраних сполук, описана в (се) прикладі Мо1. т Четвертий і кінцевий етапи процесу включали перевірку отриманих сполук в аналізі з використанням іонних каналів. Із 800 молекул, відібраних на основі детермінанти Ме12, двадцять три сполуки показали щонайменше (95) 50 4090 інгібіторну активність при випробуванні в концентрації ЗмкМ. Серед них три сполуки показали ІСво в щк субмікромолярному діапазоні, а одна сполука, названа сполукою РЕ, показала ІС 5о-145нМ-56нМ (п-4). Серед 1280 випадково відібраних сполук, перевірених для контролю, тільки одна молекула показала значну інгібіторну активність в нижньому мікромолярному діапазоні, і її хімічна структура містила фактично істотну частину детермінанти Мо12. Цікаве те, що при перевірці цієї ж колекції із 800 сполук на кіназі, яка, як вважають, також відіграє певну роль в імунній реакції, вісім сполук показали щонайменше 4095 інгібіторну активність при (Ф) перевірці в концентрації 5мМкМ, сполука Є показала ІСбо-1,2МкМ, і ще одна сполука, названа сполукою 50, г) показала ІСво-137нМ-48нМ (п-4). Сполуки РЕ, о і ряд близькоспоріднених молекул, також сполуки, що містять в своїх структурах детермінанту Мое12, крім того виявили здатність інгібувати натрієві канали, звичайно показуючи во 50-10095 інгібування при їмкМ. Загалом ці результати демонструють, що спосіб, запропонований згідно з цим винаходом, дозволяє вибирати і/або проектувати сполуки із множинними фармакологічними властивостями, що може представляти інтерес для розробки лікарських засобів для використання в лікуванні багатофакторних хворобливих станів, таких як, але не виключно, запалення. Також очевидно, аналогічно, що цей спосіб може використовуватися для включення нових фармакологічних властивостей в хімічні ряди, раніше позбавлені таких 65 властивостей.
Приклад Мо9 - Складання списків біологічно активних хімічних детермінант
У одному з варіантів здійснення цього винаходу, яким віддається перевага, запропонований спосіб може бути використаний для складання списків біологічно активних хімічних детермінант, які, в свою Чергу, можуть застосовуватися як довідкові бази даних для проведення раціонального конструювання лікарських засобів,
Наприклад, в комп'ютерних програмах прийняття рішень в галузі медичної хімії. Для підтвердження цього прикладами був проведений огляд наукової літератури і зібрано 25 списків фармакологічно активних молекул, кожний з яких містив хімічні структури сполук, що демонструють певну задану фармакологічну властивість, таку як, наприклад, зв'язування сигма-рецепторів, агонізм до рецепторів допаміну О 5 і антагонізм до рецепторів естрогену. Кожний список був потім проаналізований відповідно до цього винаходу шляхом вибору міри асоціації 7/0. М, як було описано в прикладі Мо2, і виведення з неї рейтингової функції (ІМ), яка була використана для оцінки внеску різних хімічних детермінант, що містяться в одному або кількох списках, що піддаються аналізу.
Ці обчислення призвели до ідентифікації великої кількості фармакологічно активних хімічних детермінант, три з яких показані в частині отриманої внаслідок матриці в нижченаведеній таблиці: р Сил йкніка Га 0 бики схе 12 Ст п ви м -- , ка «и ми о бити н.д.и
Би ща жі
С с
Ця таблиця надає довідковий список фармакологічно активних хімічних детермінант. Двадцять п'ять списків структур, що містять молекули, описані як такі, що мають одну із двадцяти п'яти різних фармакологічних властивостей, було зібрано і проаналізовано способом, запропонованим згідно з цим винаходом, 3 пе зо Використанням міри асоціації (11) і рейтингової функції (ІМ). До цих двадцяти п'яти властивостей належали: здатність зв'язувати сигма-рецептори (сигма-ліганд), агонізм до рецептора допаміну О 5 і антагонізм до ме) рецептора естрогену (антагоніст естрогену). Невелика частина отриманої в результаті 26-стовпчикової матриці с показана в таблиці вище. Значення більше ніж 1 вказують на те, що імовірність випадкового з'явлення в певній множині молекул, що мають одну і ту ж фармакологічну властивість, у хімічної детермінанти менш ніж 1 до 20, Ме
Зв Вказуючи на те, що ця детермінанта ймовірніше усього лежить в молекулярній основі цієї властивості. Таблиці, М подібні показаній вище, є сховищами біологічно активних детермінант, або фінгерпринтів, які можуть бути використані як довідкові списки для прийняття інформованих рішень в процесі відкриття і розробки лікарських засобів.
Отримана в результаті таблиця інтерпретується таким чином. Сполуки, в хімічній структурі яких міститься « детермінанта Мо13, з більшою імовірністю виявлять властивості агоніста рецептора допаміну ОО 2, ніж ву) с властивості зв'язування сигма-рецептора або антагоніста рецептора естрогену, оскільки 8,12 »1,8520,05. . Навпаки, детермінанта Мо13 є детермінантою, якій віддається перевага, для побудови колекцій потенційних ит агоністів рецептора допаміну ОО», оскільки 8,1222,9320,00. Аналогічним чином, для сполук, в хімічних структурах яких міститься детермінанта Мо14, імовірність виявитися лігандами сигма-рецепторів вище, ніж імовірність виявитися агоністами рецепторів допаміну або антагоністами рецепторів естрогену, оскільки -І 2,420,00-0,00. Знов таки, детермінанта Мо14 є детермінантою, якій віддається перевага, для складання множин лігандів сигма-рецепторів, оскільки 2,4021,8520,91. Нарешті, у сполук, в хімічній структурі яких міститься і, детермінанта Мо15, більше імовірність проявити властивості інгібування рецепторів естрогену, оскільки ко 28,1722,9320,91, і, навпаки, детермінанта Мо15 є фінгерпринтом, якому віддається перевага, для складання колекцій потенційних антагоністів рецепторів естрогену, оскільки 28,1720,0520,00. о Фахівцеві в цій галузі очевидно, що, замість описаних в формулах (І) і (ІМ), для побудови таких таблиць як можна використати інші міри асоціації і/або рейтингові функції. Також очевидно, що використана рейтингова функція могла б включати в себе додаткові змінні, що відносяться до речовинних, біологічних, хімічних і/або фізико-хімічних властивостей структури, як згадувалося в прикладі Мо1, але не виключно. Очевидно також і те, в що рейтингову функцію або сам процес оцінювання можна було 6 перетворити до такого вигляду, щоб включити етап зважування або нормалізації для кращої сумісності рейтингових значень один з одним, що, визначено,
Ф) характерно для показаної вище таблиці, в побудові якої використовувалися три аналогічного обсягу вибірки, але ка що може бути зовсім не так для інших наборів даних. Нарешті, очевидно і те, що цей же процес можна використати для складання довідкових списків структур, оцінених за внеском в інші властивості, що бо представляють інтерес в процесі відкриття, таким як, але не виключно, загальнотерапевтичне застосування, токсичність, поглинання, розподіл, метаболізм і/або виведення.
Приклад Мо10 - Прогнозування вторинних фармакологічних дій молекули
Цей винахід крім того може бути використаний для прогнозування вторинних дій молекули. Ілюструючи це, був ідентифікований новий клас інгібіторів іонних каналів, як показано в прикладі Мо3. Як було описано вище б5 для інших інгібіторів цього ж каналу, в базовій хімічній структурі цього нового хімічного ряду інгібіторів містилася хімічна детермінанта, показана в панелі В у прикладі Мо3, а саме в формі детермінанти Мо5, показаній в панелі А в прикладі Мо3. При порівнянні детермінанти Мое5 із детермінантами, що містяться в приведеній вище таблиці, була висунена гіпотеза, що у інгібіторів, що представляють інтерес, дуже висока імовірність зв'язування з сигма-рецепторами, особливо оскільки хімічна структура детермінанти Мо5 ідентична хімічній структурі детермінанти Мо14. Як наслідок, інгібітори каналів, що містять детермінанту Мо5, були перевірені в пробах на зв'язування сі со рецепторів, і було виявлено, що вони виявляють субмікромолярну спорідненість до обох місць.
Як такі, ці результати демонструють, що рейтингові значення, отримані з використанням способу, запропонованим згідно з цим винаходом, дозволяють прогнозувати вторинні дії хімічного ряду, що надзвичайно 70 Корисно для прогресії рядів в медичній хімії.
Приклад Мо11 - Ідентифікація і прогнозування токсичних дій молекули
Із попередніх прикладів ясно, що спосіб, запропонований згідно з цим винаходом, може бути також використаний для ідентифікації токсикофорних хімічних детермінант, що містяться в пестицидах, гербіцидах, інсектицидах і тому подібному, і це можна зробити за допомогою простого аналізу списків структур, анотованих 7/5 за токсикологічними, замість фармакологічних властивостей. У цьому контексті цей винахід може бути безпосередньо застосований для ідентифікації більш дійових, селективних і/або більш широко діючих токсичних хімічних рядів для застосування, наприклад, в агрохімічних програмах захисту культур.
Або цей винахід може бути використаний для складання довідкових списків, або баз даних, токсичних хімічних детермінант ідентичним описаному в прикладі Мо9 чином. Такі списки потім можуть використовуватися для оцінки імовірності того, що який-небудь хімічний ряд виявить певну задану токсичну дію, що корисно, наприклад, в скринінгу харчових домішок і хімічних продуктів, що впливають на навколишнє середовище.
Ілюструючи можливість прогнозування токсичних дій в ході фармацевтичних досліджень, було перевірено 4480 сполук на клітинній фосфатазі, що представляє інтерес в лікуванні запалень. У загальній кількості 25 сполук показали щонайменше 4095 інгібіторну активність при перевірці при концентрації 1ОмкМ у пробі, всіз су яких демонстрували ІС5о в нижньому мікромолярному діапазоні. Результати аналізу, проведеного способом, запропонованим згідно з цим винаходом, призвели до ідентифікації двох молекулярно відмінних одна від одної і) хімічних детермінант, які найвірогідніше лежать в основі фармакологічної активності, які були названі детермінантами Мо16 і Мо17. Оскільки ці дві детермінанти були присутніми у молекулах, які виявляють однакову дієвість, і обидві, здавалося, були здатні утворювати хімічні ряди, що однаково вимагали додаткової «-- зо перевірки, було вирішено вибрати одну із двох на основі передбачених токсичних побічних ефектів.
Для цього структури детермінант Мо16 і Мо17 були порівняні зі структурами, що містяться в токсикологічній і. базі даних, і було виявлено, що у молекул, що містять в структурі детермінанту Ме16, імовірність виявитися Га цитотоксичними була вищою, ніж у сполук, що містять тільки детермінанту Мо17. Це вказує на те, що інгібітори фосфатази, що містять детермінанту Мо1б, були б менш цікаві для прогресії через властиву цьому о фармакологічному фінгерпринту цитотоксичність. Ця гіпотеза була перевірена експериментально впливом на ї- вирощені в культурі клітини обох класів інгібіторів в концентрації їмкМ і вимірюванням життєздатності клітин із використанням стандартного мікроцитотоксичного аналізу (МТТ), внаслідок чого було виявлено, що всі сполуки, що містять детермінанту Мо16, викликали некроз клітин на протязі доби після застосування, чого не відмічалося для більшості сполук, що містять детермінанту Мо17. Як такі, ці результати ясно демонструють, що « спосіб, запропонований згідно з цим винаходом, дозволяє ідентифікувати і/або прогнозувати хімічні ряди, які шщ с ймовірніше усього виявлять токсичні властивості в певній обстановці. У цьому контексті абсолютно очевидно, що й ідентичні обчислення можуть бути виконані з використанням, наприклад, даних мутагенності (тест Еймса), даних «» інгібування изоферменту Р450 або даних, отриманих із будь-якого іншого релевантного випробування на токсичність.
Приклад Мо12 - Ідентифікація біологічно активних субодиниць рецепторних лігандів -І Як мішень, що представляє інтерес в лікуванні певних ендокринних порушень, був вибраний поверхневий клітинний рецептор. Цей рецептор описувався як нонапептидний ендогенно активований гормон, вироблюваний о гіпофізом. Після перегляду наукової літератури був складений список хімічних структур, описаних як ліганди ка цього рецептора. Цей список був потім проаналізований способом, запропонованим згідно з цим винаходом, із 5р використанням міри асоціації, рейтингової функції (ІМ), і списку хімічних детермінантів, що містить фрагменти о двадцяти поширених амінокислот (гліцину, аланіну, валіну, лейцину, ізолейцину, проліну, серину, треоніну, - М тирозину, фенілаланіну, триптофану, лізину, аргініну, гістидину, аспартату, глютамату, аспарагіну, глютаміну, цистеїну і метіоніну), доповнені фрагментами структури основного ланцюга пептиду (-МН-СН-СО-)3. Приклади цих детермінант показані нижче:
Ф) іме) 60 б5
70 | | « трико тала но тва па
І я | як їх у - й й. не й І. шо ; ; ! / : сч : ; (8)
Оспеикий шили літу Кі ж чу ще їх " 5 1. бі - 7 й - - " ї со на. їй. б ол нале Як см
Це приклади використаних для аналізу хімічних детермінант, отриманих з амінокислот і основного ланцюга б»
Зв пептиду. Список рецепторних лігандів був складений внаслідок огляду наукової літератури і проаналізований М способом, запропонованим згідно з цим винаходом із використанням міри асоціації (ІІ), рейтингової функції (ІМ), і списку хімічних детермінант, що містить фрагменти двадцяти поширених амінокислот, доповнені фрагментами структури основного ланцюга пептиду (-МН-СН-СО-)3. Приклади певних із цих детермінант, отриманих із триптофану, показані в перших двох рядах. Це були або точні фрагменти (наприклад, детермінанти «
Ме18, 19, 20, 21 ї 26), агрегати з точних фрагментів (наприклад, детермінанта Мо22), неточні фрагменти У с (наприклад, детермінанти Мо23, 24 і 25), або агрегати з точних і неточних фрагментів (не показані). Нижні два ряди: приклади детермінант, отриманих зі структури основного ланцюга пептиду (-МН-СН-СО-) 3, що
І.Й а представляють точні (детермінанти Мо29, 31, 32) і неточні фрагменти (детермінанти Мо27, 28, 30, 33). Символи: А представляє С або 5; В представляє С або М; Е представляє С, М, О або 5.
Оцінювання цих фрагментів за допомогою формули (ІМ) призвело до ідентифікації ряду хімічних детермінант -І з рейтинговими значеннями вище за 1, що вказувало на те, що у відповідних структур імовірність з'явлення в цій підмножині фармакологічно активних компонентів лише завдяки чистому випадку менше за 1 до 10 (р«е0,05). ісе) Приклади таких детермінант показані нижче разом з їхніми відповідними оцінками: іме) с 50 -
Ф) іме) 60 б5 с їх у, й
Ка. мо. но. а ше. 37 7 вксше шДЙЮ важ ЛУ о Ришее з ЗОВ пе ж 3.7
І іч у ешше Ше що На. як Ма. за но. о
Іза з ВШ. ЯКІ. ри з ЛЕ Міш ш ДА
Це приклади високо оцінених хімічних детермінант, ідентифікованих в першому циклі аналізу. Колекція рецепторних лігандів аналізувалася відповідно до способу, запропонованого згідно з цим винаходом, шляхом с оцінювання хімічних детермінант, показаних вище, а також ряду інших, за допомогою рейтингової функції (ІМ). о
Значення вище за одиницю вказували на те, що імовірність з'явлення в цій підмножині рецепторних лігандів лише завдяки чистому випадку у детермінанти була менше ніж 1 до 20. На Фіг. вище показані певні з хімічних детермінант, які були ідентифіковані в цьому процесі.
Відповідно, ці детермінанти були прийняті як такі, що представляють одну або кілька амінокислот, що ч містяться в первинній послідовності пептидного гормону, і були зібрані у другий список. Потім були повторені обчислення з використанням формули (ІМ), щоб ідентифікувати поєднання цих нових детермінант, що дають о найвищі оцінки, багато які з яких дістали оцінку вище ніж 10. Структура хімічної детермінанти, що отримала Ге найвищу оцінку, названої детермінантою Мо42, була потім порівняна зі структурами 800 дипептидів, що складаються з різних комбінацій 20 амінокислот, і було визначено, що тільки одна дипептидна послідовність, Ф названа А.--А», містила детермінанту Мо42. Цей результат був витлумачений як такий, що вказує на те, що ї- цікавлячий гормон ймовірніше усього містив цю послідовність А-Ао десь в своїй первинній структурі, і, більш того що в скріпленні цього ендогенного ліганду з його рецептором відігравали важливу роль щонайменше дві амінокислоти. Перевірка цієї послідовності гормону виявила, що він дійсно містив передбачену послідовність «
А.-А», подію, імовірність виникнення якої завдяки чистому випадку обчислювалася лише як 0,019. Цікава та обставина, що інша робота показала, що пептиди, що містять мутацію в позиції А 5» послідовності А./-А» - с (наприклад, А.-Аз, або А.-Ау, замість А.-А», де Аз, А», Аз і Ау - це різні амінокислоти), демонстрували помітно ч меншу спорідненість до цього рецептора, вказуючи на те, що щонайменше один із двох передбачених залишків ,» дійсно являв собою важливу субодиницю, що лежить в основі цієї біологічної функції цікавлячого гормону.
Загалом ці результати демонструють, що спосіб, запропонований згідно з цим винаходом, дозволяє ідентифікувати біологічно активні субодиниці пептидних лігандів, що корисно в програмах медичної хімії, -і спрямованих на раціональне конструювання, наприклад, інгібіторів, що симулюють пептиди ферментів і/або пептидних лігандів.
Приклад Мо13 - Прогнозування взаємодій "білок-білок ко Цей винахід також дозволяє прогнозувати взаємодії "білок-білок" аналогічним описаним в попередньому с 50 прикладі чином. Для підкріплення цього прикладами, був здійснений скринінг іонного каналу, як було описано в прикладі МоЗ3, який призвів до ідентифікації більш двох дюжин молекул, що демонструють щонайменше 4095 -. й інгібування при випробуванні в концентрації 5мкМ. Хімічні структури цих інгібіторів були зібрані в список, який був проаналізований, як описано в прикладі Ме12. Це призвело до ідентифікації ряду похідних амінокислот, що високо оцінюються, і структури основного ланцюга пептиду хімічних детермінант, які, як було виявлено в ході подальшого аналізу, вказували на те, що канал, що представляє інтерес, ймовірніше усього взаємодіє з інгібіторним пептидом або білком, що особливо містить певну дипептидну послідовність, названу Авб-Ав. Цікаво о те, що такі інгібіторні білки раніше описувалися в літературі і всі з них містили "каналоінгібуючу" ділянку ко із 20 амінокислот, що включала в себе якраз передбачену пептидну послідовність А 5-Ав. Оскільки може бути визначено, що імовірність певної послідовності розташування двох певних залишків завдяки чистому випадку 60 для будь-якої 20-ти амінокислотної послідовності становить лише 0,046, може бути оцінено, що імовірність правильного прогнозування наявності двох відмінних дипептидних послідовностей, присутніх в двох неспоріднених білках, завдяки чистому випадку в цьому і в попередньому прикладі менше за 1 на 1097. Проте, правильний прогноз був зроблений в обох випадках, демонструючи, що цей винахід дозволяє ідентифікувати іМабо прогнозувати наявність певних заданих типів взаємодій "білок-білок'; Це можна зробити, просто 65 ідентифікувавши послідовність амінокислот, що містять найбільшу з можливих хімічну детермінанту, ідентифіковану в цій підмножині фармакологічно активних структур, і потім відшукавши в базах даних послідовність білків, що містять цікавлячу амінокислотну послідовність. Опис цього процесу дається в прикладі
Мо14 нижче. У цьому контексті фахівцеві в цій галузі буде очевидно, що цей підхід не обмежується виключно ідентифікацією дипептидних послідовностей, оскільки, в залежності від структур фармакологічно активних сполук, що піддаються аналізу, можна було б також виявляти трипептидні і навіть тетрапептидні послідовності.
Очевидно і те, що подібний підхід можна було б використати і для непептидних лігандів, тобто запропонований спосіб можна було б також адаптувати для виявлення, наприклад, вуглеводневих послідовностей (тобто цукру), нуклеотидів, і тому подібного.
Приклад Мо14 - Ідентифікація пар "сирітський ліганд-рецептор" 70 Цей винахід, крім того, може бути застосований для ідентифікації сирітських лігандів і/або пар "сирітський ліганд-рецептор". Процес починається зі складання списку хімічних структур, що чинять певну задану дію на білок, що представляє інтерес, (звичайно це зв'язування), але для якого на момент дослідження ніякі ліганди не відомі. Ця інформація може бути отримана цілим рядом способів, таких як, але не виключно, проведення досліджень методом ядерного магнітного резонансу, вимірювання змін конформації молекул 7/5 круговим дихроїзмом, вимірювання взаємодій між білком і лігандом поверхневим плазмон-поляриторним резонансом, або, у разі сирітського рецептора, проведенням тестів із використанням конститутивно-активованих мутантів рецептора, що представляє інтерес.
Як ілюстрацію цієї концепції припустимо, що експерименти описаного вище типу проводяться на сирітському рецепторі, даючи показані нижче структури: у у | ; до о з (8) «- " (зе) " : с . (о) 35 . че і. й -
Г.Й - и? -і се) І . іме) (95) : ' - 59 Це гіпотетичний список структур, проаналізованих на наявність біологічно активних хімічних детермінант.
ГФ) Показані вище дев'ять структур були проаналізовані відповідно до цього винаходу, як було описано в прикладі
Мо12, із використанням вищезазначеного списку похідних амінокислот і структури основного ланцюга пептиду о хімічних детермінант.
Аналіз цих структур за методикою, описаною в прикладі Мо12, призводить до ідентифікації ряду похідних 60 амінокислот і структури основного ланцюга пептиду хімічних детермінант з оцінкою вище ніж 1. Приклади таких детермінант показані нижче разом із відповідними оцінками: б5 й ма Кг!
Рейтинг «443 0 Рейтинг ж 4,90
Це приклади високо оцінених хімічних детермінант, ідентифікованих в першому циклі аналізу. Колекція гіпотетичних рецепторних лігандів аналізувалася відповідно до способу, запропонованого згідно з цим т винаходом, шляхом оцінювання хімічних детермінант, показаних в першій панелі в прикладі Мо12, а також ряду інших, за допомогою рейтингової функції (ІМ). Значення вище за одиницю вказували на те, що імовірність з'явлення в цій підмножині рецепторних лігандів лише завдяки чистому випадку у цієї детермінанти була менше за 1 до 20. Вище показані дві з хімічних детермінант, які були ідентифіковані в цьому процесі.
З цих прикладів ясно, що детермінанти Мо43 і Мо44 можуть міститися тільки в хімічних структурах амінокислот фенілаланіну і тирозину. Саме по собі це підводить до висновку про те, що пептиди, які взаємодіють із сирітським рецептором, ймовірно містять в своїх послідовностях залишок або тирозину, або фенілаланіну, і що ці залишки ймовірно відіграють важливу роль або в скріпленні ліганду (лігандів) і/або активації цього рецептора цим пептидом (цими пептидами). Якщо детермінанти Мо43 і Мо44, що високо оцінюються, потім піддати повторному аналізу, щоб визначити, чи не дадуть поєднання із фрагментами інших амінокислот см 29 структури з ще більшими оцінками, можна додатково ідентифікувати такі фрагменти, як детермінанта Мо45, Го) показана в наступній панелі А.
А ці г: і . і ' . -- " 7 ' к '. чу. м : о -й сч ; (22)
І ми ю квіцин - ія ди таро
У цих панелях показані хімічні детермінанти з високим оцінним значенням, ідентифіковані у другому циклі « аналізу. Хімічні детермінанти, такі як описані раніше, були повторно аналізовані відповідно до цього винаходу, щоб визначити, чи не створять поєднання із фрагментами інших амінокислот структури з ще більш в с високими оцінками. Одна з них, названа детермінантою Мо45 (панель А), була оцінена вище ніж 40. Цікаво "» зазначити, що в цій структурі дипептидної послідовності тирозин-гліцин (панель В) детермінанта Мо45 міститься " повністю, з чого можна зробити висновок, що ендогенний ліганд сирітської мішені, що представляє інтерес, містить тирозин-гліцинову дипептидну послідовність в своїй первинній структурі.
Оскільки ясно, що в структурі тирозин-гліцинового (Туг-СІу) дипептиду детермінанта Мо45 міститься ш- повністю, можна зробити висновок, що сирітський ліганд (ліганди), що шукається нами, ймовірніше усього
Ге) містить тирозин-гліцинову послідовність десь в своїх первинних структурах. На основі цієї інформації можна зробити скринінг баз даних амінокислот, щоб ідентифікувати відомі і/або сирітські ліганди, що містять о передбачену тирозин-гліцинову послідовність, які, після відбору і експресії можуть бути перевірені в 2) 20 оригінальному біохімічному відбірному аналізі. Або хімічну детермінанту Ме45 можна безпосередньо використати для складання колекцій сполук потенційних тирозин-гліцинових імітаторів. -6ь Нарешті, варто зазначити, що використані в цьому прикладі хімічні структури фактично є агоністами опіоїдних рецепторів, взятими з літератури, і всі природні агоністи опіоїдних рецепторів - динорфін А,
В-ендорфін, лей-енкефалін і метенкефалін - містять тирозин-гліцинову послідовність в своїх первинних 22 структурах. Оскільки, як було показано, тирозиновий залишок абсолютно необхідний для діяльності опіоїдного
Ф! агоніста, даний приклад є ще одним підтвердженням здатності способу, що пропонується згідно з цим винаходом ідентифікувати біологічно активні субодиниці рецепторних лігандів. Очевидно також і те, що описані вище о обчислення можна удосконалити за допомогою альтернативних алгоритмів, що використовують змінні х, у, 2 і М, таких як, наприклад, в точному критерії Фішера. Адже проаналізовано було тільки дев'ять структур, причому за 60 допомогою способу, в який не було внесено належної поправки на малий обсяг вибірки, що дозволяє допустити, що оцінка 41,96 для детермінанти Мо45 може бути дещо завищеною.
Приклад Мо15 - Ідентифікація ендогенних модуляторів мішеней лікарських засобів
Фахівцеві в цій галузі очевидно, що цей винахід може бути також застосований для ідентифікації ендогенних модуляторів мішеней лікарських засобів. Для підтвердження цього прикладами був розроблений функціональний бо аналіз для іонного каналу, що представляє інтерес в лікуванні дегенерації нервових волокон. Була піддана скринінгу колекція сполук, і отриманий в результаті список інгібіторів був проаналізований на наявність біологічно активних хімічних детермінант, як описано в прикладі Мо2. Це призвело до ідентифікації хімічної детермінанти, що високо оцінюється, яка була виявлена в підмножині молекул, ендогенно вироблюваних еукаріотними клітинами. Відповідні сполуки були потім придбані і перевірені в аналізі, внаслідок чого було виявлено, що канал, що представляє інтерес, селективно інгібувався клітинним фосфоліпідом певного підкласу в субмікромолярних концентраціях, що, вельми цікаво, раніше іншими групами зв'язувалося з апоптозом нервових клітин за невідомим механізмом дії. Загалом, ці результати демонструють, що цей винахід дозволяє ідентифікувати ендогенні модулятори мішеней лікарських засобів. 70 Приклад Мо16 - Ідентифікація хибнопозитивних експериментальних результатів
Був розроблений ферментативний метод аналізу для протеїнкінази, яка, як вважається, відіграє важливу роль в імунній реакції. Для скринінгу за цією мішенню була зібрана колекція сполук відповідно до цього винаходу, а саме, як описано в прикладі Мо2. Сполуки з цієї колекції були потім перевірені в аналізі при концентрації 5мМкМ, що призвело до ідентифікації 35 молекул, що демонструють інгібування щонайменше 40905. 7/5 Структури цих сполук були проаналізовані за допомогою спрощеного варіанту формули (ІІ), використаного як рейтингова функція, і відповідні оцінки були безпосередньо порівняні зі значеннями зі статистичної таблиці, що дозволило оцінити імовірності з'явлення даних хімічних детермінант в цій підмножині із 35 фармакологічно активних сполук завдяки чистому випадку.
При використанні порогового значення імовірності випадкового з'явлення р «0,05, було визначено, що 14 із 200 35 інгібіторів ймовірніше усього представляли хибнопозитивні результати. Подальша переперевірка цих 14 сполук в аналізі підтвердила цю гіпотезу, показуючи, що цей винахід дозволяє ідентифікувати хибнопозитивні експериментальні результати.
Приклад Мо17 - Ідентифікація хибнонегативних експериментальних результатів
За допомогою обчислень, аналогічних описаним в прикладі Мо1б, цей винахід, крім того, дозволяє с ідентифікувати хибнонегативні експериментальні результати. Для підтвердження цього прикладами були проаналізовані на наявність фармакологічно активних хімічних детермінант, як описано в прикладі Мо16, хімічні і) структури ряду інгібіторів фосфатази. Отримані в результаті хімічні детермінанти з найвищими оцінками були використані як фармакологічно активні "фінгерпринти" для проведення пошуків підструктур в списку хімічних структур, відповідних сполукам, що спочатку випробовувалися в цій пробі. При цьому був виявлений ряд «- зо Молекул, що містили одну або більш вищезазначених хімічних детермінант, але які, проте, були ідентифіковані як негативні при скринінгу. Відповідні молекули були потім перевірені, внаслідок чого було виявлено, що більш ме) ніж 1595 із них були хибнонегативними, а одна сполука навіть продемонструвала субмікромолярну інгібіторну с активність. Ці результати ясно демонструють, що спосіб, запропонований згідно з цим винаходом дозволяє ідентифікувати хибнонегативні експериментальні результати. Ме
Приклад Мо18 - Проведення кількісних конфігураційних і конформаційних аналізів ч-
У одному вдосконаленому варіанті здійснення цього винаходу можна також використати алгоритми, що включають різні поєднання змінних х, у, 2 і М, для проведення конформаційного і/або конфігураційного аналізу.
Проілюструємо цю можливість: із результатів, показаних в прикладі Мо4, ясно, що структура фармакологічно активного, інгібуючого протеазу "фінгерпринта", показаного в панелі В в прикладі Мо4, не визначена ні відносно « конфігурації, ні відносно конформації. | дійсно, за представленою структурою неможливо визначити, чи активна п) с фармакологічно відносно двох карбонільних або сульфонільних груп трансоїдна конформація або цисоїдна . конформація варіанту фінгерпринта із простим зв'язком, або, більш того у разі варіанту цієї ж структури з а подвійним зв'язком, активна конфігурація (Е) або конфігурація (7) фінгерпринта. Причина цього в тому, що обчислення, що виконувалися в прикладі Мо4, були спрямовані на ідентифікацію хімічної детермінанти, найвірогідніше активності інгібування протеази, що лежала в основі, без урахування можливих конформацій і/або -І конфігурацій, який така детермінанта може приймати. У зв'язку з тією обставиною, що багато які фармакологічно активні структури містять подвійні зв'язки і/або кільцеві системи, що обмежує хімічні детермінанти в і, конформаційному значенні, скорочуючи загальну кількість здатних обертатися зв'язків, цей винахід можна ко використати для визначення того, які конформації і/або конфігурації хімічної детермінанти ймовірніше усього будуть фармакологічно активні. о Для підтвердження цього прикладами шість (інгібуючих протеазу) структур, показаних в прикладі Мо4, були як проаналізовані шляхом оцінювання ряду конформаційно і конфігураційно визначених хімічних детермінант, отриманих зі структури, показаної в панелі В в прикладі Мо4, за допомогою рейтингової функції (ІМ).
Шрастий збо Простий обо 255 подій й нодійний о -к-- мч ворс іме) 7 нн шо
Тейтиш з. 35,90 Пойтине ж 14
Ця панель ілюструє конформаційний/конфігураційний аналіз інгібуючої протеазу хімічної детермінанти. Шість структур, показаних в прикладі Мо4, були проаналізовані відповідно до цього винаходу з використанням списку 65 конформаційно і конфігураційно визначених хімічних детермінант.
Хімічна детермінанта Мо4б, показана поруч із такою, що отримала нижчу оцінку, детермінантою Мо47,
отримала одну з найвищих оцінок, що означає, що у конфігурації (7) варіанту фінгерпринта з подвійним зв'язком велика імовірність бути переважним розташуванням в хімічних структурах інгібіторів протеази, що представляють інтерес. Ця гіпотеза була згодом перевірена додатковим цілеспрямованим високопродуктивним бкринінгом, внаслідок якого були виявлені численні інгібітори протеази, в яких цей фармакологічно активний фінгерпринт дійсно містився лише в (7) або "цисоїдної" конфігурації, і зовсім мало таких, де це було не так.
Загалом, ці результати демонструють, що спосіб, запропонований згідно з цим винаходом, дозволяє ідентифікувати біологічно активні конформації і/або конфігурації хімічних детермінант. Нарешті, абсолютно очевидно, що такі обчислення можуть бути виконані за допомогою ряду альтернативних алгоритмів, що 7/0 Використовують поєднання змінних х, у, 2 і М. У цьому контексті корисно згадати те, що описаний вище процес оцінювання можна ще більш удосконалити, включивши в ці різні рейтингові функції додаткові змінні, наприклад, ті, що враховують фармакологічну дієвість хімічних структур, але не тільки.
Приклад Мо19 - Проведення пошуків за подобою
З попередніх прикладів ясно, що концепція подібності молекул, як вона трактується способом, /5 запропонованим згідно з цим винаходом, разюче відрізняється від загальноприйнятого значення цього терміну.
Наприклад, сполуки в гіпотетичному списку в прикладі Мо14 дуже несхожі, в тій мірі, в якій не існує очевидного способу звести ці дев'ять молекул в одне хімічне сімейство класичними методами групування. Проте, в прикладі
Мо14 було показано, що ці сполуки, насправді, надзвичайно схожі, в тій мірі, в якій кожна містить щонайменше одне входження хімічної детермінанти, що є представницьким фрагментом амінокислоти тирозину; дивись го панель нижче:
НИ ч- Я - . о . -- й й їз в ФІ й . Й ї т й т й Б. Й Ге шо ' - ЩЕ й ол очашШИе й і - ч й . ф т ді й і5 - оч і й и, і : ше і в Ша: тА, се)
Це фрагменти амінокислоти тирозину в структурах дев'яти агоністів опіоїдних рецепторів. Показані вище о структури несхожі в тій мірі, в якій важко їх зібрати в єдине хімічне сімейство класичними методами оо 20 групування. Проте вони дуже схожі в значенні цього винаходу, оскільки всі вони містять щонайменше один фрагмент хімічної детермінанти, що є амінокислотою тирозином, входження якої виділені жирними лініями. -З Як такий, цей винахід можна легко використати для вимірювання подібності молекул і/або для порівняння подібностей, які можуть існувати між різними множинами хімічних сполук. Коротко проілюструємо цю концепцію: абсолютно очевидно, що зі списку хімічних структур можна вибрати одну або більш опорних молекул і 22 проаналізувати на наявність певних заданих хімічних детермінант, які, після ідентифікації, можна використати
Ф! для проведення одного або більш пошуків підструктур в одній або більш нових молекулах, щоб визначити, чи подібні вони до першої. Шляхом оцінювання відповідних хімічних детермінант рейтинговою функцією описаного в де попередніх прикладах типу і шляхом оцінювання цих нових хімічних структур на основі, наприклад, кількості різних детермінант, які вони можуть містити, молекулам, що випробовуються, можна присвоїти значення, що 60 відображають ступінь подібності з первинною множиною опорних сполук. Цей процес дуже корисний в конструюванні цілеспрямованих колекцій сполук для відкриття нових лікарських засобів, оскільки дозволяє досліднику швидко ідентифікувати сполуки, що мають значну подібність, в значенні цього винаходу, з фармакологічно активними опорними сполуками.
Приклад Мо20 - Аналіз різноманітності колекцій сполук б5 Цей винахід, крім того, може бути використаний для аналізу різноманітності колекції сполук аналогічним описаним в попередньому прикладі чином. У цьому контексті фахівцеві в цій галузі очевидно, що концепцію хімічних детермінант можна легко використати для порівняння певної даної колекції сполук із будь-якою іншою.
Наприклад, можна вибрати для високопродуктивного скринінгу колекцію сполук шляхом аналізу відповідного списку хімічних структур відповідно до цього винаходу, в якому певна опорна множина хімічних структур, таких як такі, що містяться в базах даних МегскК Іпаех, Оеглепі, МООК або РІпагтаргоі|есів, буде використовуватися як опорна множина "подібних лікарським засобам" молекул. У цьому разі молекули, структура яких по суті складається з хімічних детермінант, що мають низькі оцінки, вважаються "подібними лікарським засобам", оскільки ці хімічні детермінанти присутні у високій пропорції опорних структур. Навпаки, молекули, що по суті /о0 бкладаються з хімічних детермінант, що мають високі оцінки, вважаються "неподібними лікарським засобам", оскільки ці детермінанти лише дуже слабо представлені в цій множині опорних сполук. Ця інформація дуже корисна для планування спрямованих на відкриття експериментів, оскільки допомагає досліднику ідентифікувати хімічні структури, які потрібно включити в колекцію сполук для скринінгу або виключити з неї. У цьому контексті очевидно, що для цієї мети можна використати ряд алгоритмів, що включають різні комбінації змінних 75 ХУ, ЇМ.
Приклад Мо21 - Спеціальні алгоритми
Абсолютно ясно, що попередні приклади не надають вичерпного списку всіх алгоритмів, що використовують комбінації змінних х, у, 2 і М, які можна використати для проведення дискретного структурно-фрагментарного аналізу.
У цьому контексті фахівцеві в цій галузі очевидно, що рейтингові функції (ХІІ), (ХХІ) ї (ХІМ) також можна використати для вирішення ряду питань, що ставляться в попередніх прикладах. І дійсно, в певних випадках навіть більш доречно, в статистичному відношенні, застосувати одну з цих формул, замість описаних в цих прикладах. Однак, оскільки цей винахід призначений, головним чином, для ідентифікації хімічних детермінант, що містяться в певному списку хімічних структур, які ймовірніше усього лежать в основі певної сч заданої біологічної дії, нас цікавлять головним чином відносне оцінювання і подальше ранжування хімічних детермінант. Проте нижче наводяться формули (ХІЇ), (ХНІ) ї (ХІМ) на той випадок, якщо: а) для невеликих і) вибірок потрібна точна оцінка імовірності випадкового з'явлення (дивись ХІЇ, де з відповідає мінімальному значенню змінних ох, (у-х), (2-х) і (М-у-2х)); Б) для використання в прикладі Мо8 більш придатним представляється пропорціонально зважена оцінка одночасних внесків двох детермінант (дивись ХІЇЇ, де й «- зо Відповідає кількості окремих хімічних детермінант); або с) вважається важливим оцінити інші дії при оцінюванні одночасних внесків двох взаємопов'язаних хімічних детермінант (дивись ХІМ). У цьому контексті ме) визначення змінних х, у, 2 і М точно такі ж, як описані раніше. с (ХИ)Оцінкат уд
У Ум-УацМч- г Ф з5 | ху - хг -х(М- у -2 КИМ а (ХП) Оцінка: д Мк -уг п щм-2 -у у ух
М | Я М | їх
НИ - (ХІМ) Оцінка - с (у2-М-17 - 2 (Мі у-2 ок)
Нарешті, фахівцеві в цій галузі очевидно, що використання певних змінних в оцінних функціях і/або -І алгоритмах, призначених для ідентифікації біологічно активних хімічних детермінант, але явно не описаних в попередніх прикладах, може бути математично еквівалентно використанню різних комбінацій змінних х, у, 2 і М. шо Проілюструємо це на прикладі: рейтингова функція, що використовує змінну 4, що за визначенням представляє ко кількість неактивних молекул, в хімічній структурі яких міститься певна хімічна детермінанта, еквівалентна використанню х і у, оскільки д-ху-х. Аналогічно, рейтингова функція, в якій використовується змінна г, що за
Мамі визначенням представляє загальну кількість активних сполук, що не містять певної заданої хімічної - М детермінанти, алгебраїчно еквівалентна застосуванню змінних х і 7, оскільки можна легко показати, що г-2-х. 1 ще, рейтингова функція, в якій використовується змінна 5, що за визначенням представляє загальну кількість неактивних сполук, що не містять певної заданої хімічної детермінанти, еквівалентна використанню змінних х, 5 У, 2 і М, оскільки 85-М-у-2-х. Нарешті, алгоритми, в яких використовуються змінні ї і и, що відповідно представляють загальну кількість молекул, в структурах яких не міститься певної заданої детермінанти (У, |і
Ф, загальна кількість неактивних молекул (0), еквівалентні використанню змінних М, у і/або 7, оскільки можна ко легко показати, що (-М-у, а ц-М-7.
Приклад Мо22 - Відображення відносних внесків во Цей винахід також дозволяє будувати діаграми відносних внесків. Це графічні представлення хімічних структур, на яких відносний внесок атомів, зв'язків, фрагментів і/або підструктур в певний заданий біологічний результат вказується рейтинговими значеннями, обчисленими, як це описано в попередніх прикладах. У одному варіанті якому віддається перевага, здійснення запропонованого способу використовуються значення оцінки імовірності, такі як обчислювані за допомогою формули (ХІІ), де Р(А) 65 представляє імовірність того, що певний хімічний детермінант міститься в певній заданій підмножині біологічно активних структур завдяки чистому випадку, що обчислюється з використанням формул, в яких застосовуються різні комбінації змінних х, у, 2 і М, як було описано раніше. (ХІЇ) Оцінка -/1-Р(А)10090
У цьому контексті очевидно, що для оцінки Р(А) можна використати численні міри асоціації і/або рейтингові функції. Два приклади діаграм відносного внеску будуть розглянуті тепер більш детально. У приведеній нижче панелі в те й Гу Її. і щі: щи і Ве сл Ніни й : Ї Е , . ч 1 ни Ще ка: йкй й - я дк:
ГЕ; - ай "Ей Ще ім ол ь, о т. й Я т о,
Ши ше в ї зл ще. -- "ЩІ рі: - Й і і ва аа виш ви тка іа днй як сч ге Фітие ІБ зснх: АР ібн є ї но: Е Е-Щя а : а свій Га лай 7 ін і з 7 ід че в н д, й : м. в ще - що Е -КЕ ді М ній й і, ; 4 Є Е ї . з . с
І» шва. і с щі з ср М
Хійсхиє УЛ план й Кінг ке Ши показані молекули, що представляють інтерес, в супроводі ряду хімічних детермінант, що містять фрагменти -і цієї ж молекули, які були оцінені з використанням формули (ХІІ) і перетворення міри асоціації (І) для с визначення Р(А). На Фіг.15 ця ж інформація представлена в графічній формі, де накреслений графік залежності детермінант від їхніх відповідних рейтингових значень. У цьому контексті очевидно, що така ж інформація може іме) бути представлена в формі імовірнісних контурних діаграм, як показана на цій панелі. о» 70 яке: ка : ! Я й иа, во Сх ! ней й й б5 Загалом, такі діаграми дуже корисні для побудови колекцій сполук, оскільки вони допомагають досліднику у відборі сполук на основі математичних оцінок шансів на успіх в певному аналізі, що зменшує необхідність покладатися на концепцію різноманітності молекул для ідентифікації нових біологічно активних хімічних рядів.
Вони також представляють інтерес для медичної хімії, оскільки представлення, такі як показане в панелі вище, ясно вказують, які субодиниці молекули можна більш або менш змінити з мінімальним ризиком втрати фармакологічної активності. І, навпаки, такі графіки звертають увагу токсиколога на те, які субодиниці токсичної сполуки необхідно змінити, щоб усунути небажану дію.
Для отримання графічних представлень відносного внеску, показаних вище і на Фіг.15, хімічні детермінанти, відповідні фрагментам біологічно активної молекули, були оцінені відповідно до цього винаходу за допомогою 70 рейтингової функції, в якій використовуються змінні х, у, 2 і М, що дозволило безпосередньо оцінити імовірність випадкового з'явлення в цій множині активних молекул (Р(А)). Відповідні значення Р(А) були перетворені з використанням рейтингової функції (ХІЇ), внаслідок чого були отримані значення імовірності для кожної детермінанти, що відображають відносну імовірність того, що відповідна хімічна структура лежить в основі біологічної активності, що представляє інтерес. Ці значення можна відобразити, як на Фіг.15, яка є 7/5 графічним представленням цих рейтингових значень для різних хімічних детермінант. Хімічна детермінанта Мо54 відповідає локальному максимуму цього ряду. Або, ці значення можна відобразити, як в показаній вище панелі, яка є імовірнісною контурною діаграмою, що показує, який фрагмент або сектор хімічної структури, що представляє інтерес, ймовірніше усього додає біологічну активність (детермінанта Мо54, що міститься на дільниці, обмеженій 9595 контурною лінією). Інший спосіб представлення цих значень показаний на Фіг.11.
Приклад Мо23 - Еквівалентність оцінних функцій
Всі застосовані в попередніх прикладах рейтингові функції є способами ідентифікації хімічних детермінант, які ймовірніше усього лежать в основі певної заданої біологічної, фармакологічної і/або токсикологічної дії.
Хоч фахівцеві в цій галузі очевидно, що певні міри асоціації і/або рейтингові функції краще усього використовувати для розв'язання лише певних типів задач, при застосуванні, як це описано в способі, с г Запропонованому згідно з цим винаходом, кожна формула дозволяє ідентифікувати цю ж хімічну детермінанту з найвищою оцінкою, яка ймовірніше усього лежить в основі певної заданої біологічної дії. Як такі, представлені о в попередніх прикладах формули є функціональними еквівалентами в значенні дискретного структурно-фрагментарного аналізу.
Щоб продемонструвати це, вісім разів паралельно проаналізували хімічні структури 131 агоніста рецептора "де зо допаміну О» з використанням восьми мір асоціації і оцінних функцій, що містять різні комбінації параметрів х, У, 72 І М, показаних нижче. Дослідження проводилося, як було описано вище, а саме з доданням хімічних і) структур 101207 молекул, описаних як такі, що не діють на рецептор допаміну О», до першого списку з 131, Її с оцінюванням ряду з 19 показаних нижче хімічних детермінант за допомогою оцінних функцій (ХМ) - (ХХІ), в яких читач упізнає представників тих же функцій, які застосовувалися в ряді попередніх прикладів, і/або Ме близькі їхні варіанти. М а н " шй я но. 58 но. 50 Ма. ва Ма. ч - с
І» ць реч таль
Мо. бе о. а, 4 Но -І т . : до РО. т "к ; оз о І мо. ов ма: в7 ма, Бо о. 06 - | А
І о ме. 7о но. ті мо. 7 ме, 73
І-й і АЖЖ бр АЖ"
А ще А ді на. та На. 76 Мо. 7а
Це хімічні детермінанти, оцінені за допомогою восьми різних оцінних функцій. Показані вище 19 хімічних детермінант були оцінені з використанням функцій (ХМ) - (ХХІ) і списку хімічних структур, анотованих за активністю агоніста рецептора допаміну Ю». Використовувалися нижченаведені функції: (ХУ) Оцінка -МУУ.(х/2) (ХМІ) Оцінка -(х/2)-(у/М) (ХМІЇ) Оцінка -Мх-уг (ХМІІІ) Оцінка - цМм-у -х- Кк) (г-хуу-х) й (ХІХ) Оцінка - (мх | м/2у м) 2-23 у) (ХХ) Оцінка дМ-у- х-х) в ЗТ Ку- кр УДМ как) (х-хЦУ-х) (ХХІ) Оцінка - Мк - уг гм т г/м -У) (ХХІ) Оцінка - екх/лу(аюд(м-2)
На Фіг.16А-16Н показані відповідні діаграми відносного внеску. Показані в наведеній вище панелі хімічні детермінанти були оцінені, як описувалося раніше, і за їхніми відповідними оцінним значеннях були побудовані графіки. На Фіг.1б6А показані оцінки, отримані за допомогою функції (ХМ), на Фіг.16В - оцінки, отримані за с допомогою функції (ХМІ), на Фіг.16С - оцінки, отримані за допомогою функції (ХМІЇ), на Фіг16О - оцінки, (У отримані за допомогою функції (ХМІІІ), на Фіг.1б6Е - оцінки, отримані за допомогою функції (ХІХ), на Фіг.16Е - оцінки, отримані за допомогою функції (ХХ), на Фіг.160 - оцінки, отримані за допомогою функції (ХХІ), і на
Фіг.16Н - оцінки, отримані за допомогою функції (ХХІ). Кожна рейтингова функція незмінно виділяла одну і ту ж хімічну детермінанту (Мо73) як найбільш вірогідну основу біологічної активності. --
Як показують діаграми відносного внеску, представлені на Фіг.16бА-16Н, кожна з восьми оцінних функцій (се вірно ідентифікувала хімічну детермінанту Мо73 як відповідну локальному максимуму, що означало, що саме цей хімічний елемент ймовірніше усього лежить в основі активності агоніста рецептора допаміну Юо в списку з 19 с детермінант, що випробовуються. Цікаве те, що різні рейтингові функції відрізнялися в значенні ранжування Ф хімічних детермінант із більш низькими оцінками, оскільки детермінанті Моб2 надавалася важливість в біологічній активності висуненням її на третє місце в обчисленнях із використанням оцінних функцій (ХМ), - (ХМІ) ї (ХМІЇ), тоді як при використанні рейтингової функції (ХХІ) на третє місце висунулася детермінанта
Моб3, а при використанні оцінних функцій (ХІХ) і (ХХІ) третьої була детермінанта Моб5, і, нарешті, при перевірці за допомогою оцінних функцій (ХМІЇ) їі (ХХІЇ) на третє місце попала детермінанта Мобб. «
Загалом, ці невеликі розходження не важливі для успішного здійснення запропонованого способу, оскільки у З кожному разі детермінанти більш низького рангу насправді є фрагментами більш великої детермінанти Мо73 з с більш високою оцінкою (дивись панель вище). По суті, для побудови колекцій сполук для високопродуктивного
Із» скринінгу досить безпосередньо застосувати детермінанту Мо7З і її фрагменти, оскільки вони незмінно будуть містити структури, що включають в себе кожну з цих детермінант більш низького рангу. Відбір типу сполуки, яку можна було б включити до такої колекції, показаний нижче. -І се) іме) с 50 -
Ф) іме) 60 б5
9 0 швой а! -
І ен З ; с
Ці структури-зразки являють собою приклади сполук, які можна було б вибрати для приєднання до колекції сполук, призначеної для ідентифікації агоністів рецептора допаміну О 5. Кожна з показаних вище структур і) містить хімічну детермінанту Мо73, або істотну її частину.
На закінчення, і оскільки математичне обгрунтування, що стоїть за виведенням і використанням цих восьми різних оцінних функцій, різне в кожному випадку, всі вони ідентифікують одну і ту ж хімічну детермінанту, що "де зо найвірогідніше лежить в основі біологічної активності. Як такі, алгоритми, що містять різні комбінації змінних х, у, 2 і М, або ад, г, 5, їі у, як вже згадувалося вище, функціонально еквівалентні в значенні цього і) винаходу. с
Приклад Мо24 - Базований на інформатиці інструментарій для відкриття нових лікарських засобів
З попередніх прикладів очевидно, що цей винахід може бути включений в одну або більш серій процедур, Ме
Зв таких як, але не тільки, комп'ютерні програми, призначені для підвищення ефективності високопродуктивного М скринінгу, відкриття нових сполук, евристичної хімії ("від вдалої знахідки до ключа-підказки"), створенні прогресивних рядів сполук і/або попереджувальної оптимізації. Такі процедури або програми у варіанті, якому віддається перевага, призначаються для завдання напряму машинам і/або роботизованим системам, що виконують скринінг лікарських засобів, вибір сполук, формування множин і/або хімічний синтез підконтрольним, « напівавтономним або автономним чином. Такі процедури включають, але ніяким чином не виключно, в с нижченаведені приклади, що утворюють варіанти здійснення цього винаходу, яким віддається перевага: . - Процес, в якому аналізують хімічні структури, анотовані відповідними експериментальними результатами, і ит ідентифікують відповідно до цього винаходу біологічно активні хімічні детермінанти. - Процес, в якому ідентифіковані відповідно до цього винаходу біологічно активні хімічні детермінанти
Використовують для проведення пошуків в хімічних базах даних, віртуальних і інших, щоб ідентифікувати -І сполуки, біологічні препарати, реагенти, продукти реакцій, проміжні або інші, які ймовірніше усього виявлять певну фармакологічну, біохімічну, токсикологічну і/або біологічну властивість. ісе) - Процес, в якому ідентифіковані відповідно до цього винаходу біологічно активні хімічні детермінанти
ГІ зберігають в реєстрі разом із супровідними експериментальними даними і/або рейтинговими значеннями, в електронній або іншій формі, і регулярно оновлюють або не оновлюють, який служить як сховище структурної о інформації для застосування в процесі прийняття рішень, автоматизованому або не автоматизованому, для як вибору хімічних сполук, рядів і/або каркасів для високопродуктивного скринінгу, медичної хімії і/або попереджувальної оптимізації, причому вказані експериментальні результати і рейтингові значення відносяться до якої-небудь заданої фармакологічної, біохімічної, токсикологічної і/або біологічної властивості. 5Б - Процес, в якому цей винахід, як він описаний в будь-якому з попередніх прикладів, використовується для ідентифікації фармакологічних модуляторів мішеней лікарських засобів, таких як, наприклад, ліганди
Ф) рецепторів, інгібітори кінази, модулятори іонних каналів, інгібітори протеази, інгібітори фосфатази і ліганди ка стероїдних рецепторів, але не тільки. - Процес, в якому цей винахід, як він описаний в будь-якому з попередніх прикладів, безпосередньо бо використовується або застосовується в комп'ютерній програмі, призначеній для аналізу хімічних структур для підвищення дієвості певного хімічного ряду, підвищення селективності певного хімічного ряду, конструювання сполук із множинними фармакологічними ефектами, прогнозування потенційних вторинних фармакологічних дій молекули, прогнозування потенційних токсикологічних дій молекули, ідентифікації біологічно активних субодиниць рецепторних лігандів, прогнозу потенційних взаємодій між білками, ідентифікації пар "сирітський б5 Лліганд-рецептор", і/або ідентифікації ендогенних модуляторів мішеней лікарських засобів. Останні застосування відносяться, зокрема, до областей функціональної геноміки і функціональної протеоміки, в яких, наприклад, на основі хімічних структур молекул, ідентифікованих в ході біохімічного скринінгу і оброблених відповідно до цього винаходу, можуть вибиратися для дослідження, наприклад, нуклеотидні і/або амінокислотні послідовності, наприклад, для ідентифікації сирітських лігандів. - Процес, в якому цей винахід або використовується безпосередньо, або в програмах, призначених для ідентифікації хибнопозитивних і/або хибнонегативних експериментальних результатів. - Процес, в якому цей винахід або використовується безпосередньо, або в програмах, призначених для прогнозування потенційно небезпечних дій молекули на людину, велику рогату худобу і/або навколишнє середовище, такий як, наприклад, в скринінгу хімічних продуктів, призначених для використання як харчові 70 домішки, в пластмасах, текстилі і тому подібному. - Процес, в якому цей винахід використовується або безпосередньо, або в програмі, призначеній для виконання конфігураційних, конформаційних, стереохімічних аналізів, аналізів подібності і/або різнорідності. - Процес, в якому цей винахід використовується або безпосередньо, або в програмі, призначеній для створення діаграм відносних внесків і/або графічних представлень біологічно активних складових або хімічних /5 структур. - Процес, в якому будь-який з позначених вище процесів, застосований окремо або в послідовному і/або паралельному поєднанні, використовується для функціонування інструментального засобу інформатики, комп'ютерної програми і/або експертної системи, призначеної для використання в проведенні досліджень, спрямованих на відкриття нових лікарських засобів, гербіцидів і/або пестицидів. - Процес, в якому будь-який з позначених вище процесів, застосований окремо або в послідовному і/або паралельному поєднанні, використовується для завдання напряму функціонування обладнання і/або контрольно-вимірювальних приладів, в автоматичному або неавтоматичному режимі, автономно або неавтономно, з використанням реєстрів хімічних детермінант, що оновлюються, анотованих рейтинговими значеннями або не анотованими, для застосування в раціональному створенні хімічних структур, пошуку і вибірці сч хімічних сполук, раціональному складанні протоколів експериментів і/або скринінгу даних, і/або раціональному виборі результатів і/або хімічних структур в галузі фармацевтичних і/або сільськогосподарських досліджень із і) метою нових відкриттів.
Інші способи застосування цього винаходу неважко буде представити фахівцеві в цій галузі на основі звичайних знань. «- со
Claims (18)
1. Спосіб виконання дискретного структурно-фрагментарного аналізу, який передбачає використання (2) 35 комп'ютерної системи і включає такі етапи: чн звернення (210, 220, 410) до бази даних (110, 115) молекулярних структур, яка дозволяє виконувати пошук за інформацією про молекулярні структури і біологічними і/або хімічними властивостями; ідентифікація (220) в згаданій базі даних певної підмножини молекул, що мають певну задану біологічну і/або хімічну властивість; « визначення (230, 420) фрагментів молекул згаданої підмножини; з с обчислення (230, 430, 610-650) для кожного фрагмента рейтингового значення, що відображає внесок відповідного фрагмента у згадану задану біологічну і/або хімічну властивість; і :з» виконання (240, 250) циклічного процесу шляхом аналізування (250) визначених фрагментів і обчислених рейтингових значень, відповідно до якого спочатку вибирають щонайменше один фрагмент, якому відповідає рейтингове значення, що відображає високий внесок в згадану біологічну і/або хімічну властивість, і потім -1 повторюють етапи звернення, ідентифікації, визначення і обчислення.
2. Спосіб за п. 1, який відрізняється тим, що етап обчислення рейтингового значення включає операцію ре) підрахунку (610) кількості тих молекул (х) зі згаданої підмножини, що містять певний заданий фрагмент. г) З.
Спосіб за п. 1 або 2, який відрізняється тим, що додатково включає етап ідентифікації в згаданій базі даних певної другої підмножини молекул, що не мають згаданої біологічної і/або хімічної властивості, причому о згаданий етап обчислення рейтингового значення включає операцію підрахунку (620) кількості тих молекул (у) зі кч згаданих підмножини молекул і другої підмножини молекул, що містять певний заданий фрагмент.
4. Спосіб за будь-яким із пп. 1-3, який відрізняється тим, що згаданий етап обчислення рейтингового значення включає операцію підрахунку (630) кількості молекул (7) у згаданій підмножині молекул.
5. Спосіб за будь-яким із пп. 1-4, який додатково включає етап ідентифікації в згаданій базі даних певної другої підмножини молекул, що не мають згаданої біологічної і/або хімічної властивості, причому згаданий етап (Ф) обчислення рейтингового значення включає операцію підрахунку (640) загальної кількості молекул (М) у згаданих ГІ підмножині молекул і другій підмножині молекул.
6. Спосіб за будь-яким із пп. 1-5, який відрізняється тим, що згаданий циклічний процес виконується шляхом во вибору для наступного циклу фрагментів із більшою молекулярною масою, якщо порівнювати з фрагментами попереднього циклу.
7. Спосіб за будь-яким із пп. 1-6, який відрізняється тим, що додатково включає такі етапи: вибір (710) певного фрагмента, що здійснюється на основі обчислених рейтингових значень; аналіз (810) структури вибраного фрагмента; 65 знаходження (820) узагальненого елемента в структурі цього фрагмента; і заміна (830) цього узагальненого елемента певним узагальненим виразом, з утворенням родової підструктури.
8. Спосіб за п. 7, який відрізняється тим, що додатково включає етап виконання (840) віртуального скринінгу з використанням цієї родової підструктури.
9. Спосіб за будь-яким із пп. 1-8, який відрізняється тим, що етап аналізування визначених фрагментів і обчислених рейтингових значень включає такі операції: вибір (1010) певного першого фрагмента, що здійснюється на основі обчислених рейтингових значень; вибір (1020) певного другого фрагмента, що здійснюється на основі обчислених рейтингових значень; і утворення (1030) молекулярної підструктури, що включає згаданий перший фрагмент і згаданий другий 7/0 фрагмент, шляхом застосування функції відпалу.
10. Спосіб за будь-яким із пп. 1-9, який відрізняється тим, що етап аналізування визначених фрагментів і обчислених рейтингових значень включає такі операції: вибір (710) щонайменше одного фрагмента, що здійснюється на основі обчисленого рейтингового значення; вилучення (720) з попередньої підмножини молекул сполук, що містять вибраний фрагмент; вибір (730) з попередньої підмножини молекул сполук, що не містять вибраного фрагмента, або сполук, не включених в попередню підмножину молекул; і формування (740) нової підмножини молекул, що включає згадані вилучені та вибрані сполуки.
11. Спосіб за будь-яким із пп. 1-10, який відрізняється тим, що додатково включає етап утворення (230) бібліотеки (120) фрагментів, що містить визначені фрагменти і обчислені рейтингові значення.
12. Спосіб за будь-яким із пп. 1-11, який відрізняється тим, що згадана база даних не є відкритою для загального користування.
13. Спосіб за будь-яким із пп. 1-12, який відрізняється тим, що згадана база даних є базою даних загального користування.
14. Спосіб за будь-яким із пп. 1-13, який відрізняється тим, що згадана база даних є базою даних с послідовностей амінокислот і/або нуклеїнових кислот, а згаданою біологічною і/або хімічною властивістю є певний заданий вплив, що стосується відповідного білка. і)
15. Спосіб за будь-яким із пп. 1-14, який відрізняється тим, що згаданою біологічною і/або хімічною властивістю є певна фармакологічна властивість, і даний спосіб використовується для виявлення нових лікарських засобів. «- зо
16. Спосіб за будь-яким із пп. 1-15, який відрізняється тим, що додатково включає етап утворення (260) множини сполук, що містять щонайменше один із визначених фрагментів. о
17. Спосіб за п. 16, який відрізняється тим, що додатково включає етап перевірки сполук згаданої утвореної с множини на наявність згаданої заданої біологічної і/або хімічної властивості.
18. Комп'ютерна система для здійснення дискретного структурно-фрагментарного аналізу, яка включає в Ме зв себе: ї- засоби (100, 110, 115) для звернення до бази даних молекулярних структур, яка дозволяє виконувати пошук за інформацією про молекулярні структури і біологічними і/або хімічними властивостями; засоби (100, 130) для ідентифікації в згаданій базі даних певної підмножини молекул, що мають певну задану біологічну і/або хімічну властивість; « засоби (100, 130, 135) для визначення фрагментів молекул згаданої підмножини; з с засоби (100, 130, 140) для обчислення для кожного фрагмента рейтингового значення, що відображає внесок відповідного фрагмента у згадану задану біологічну і/або хімічну властивість; і з засоби (100, 130) для визначення того, чи необхідно виконувати ще один цикл процесу, і, якщо необхідно, аналізування визначених фрагментів і обчислених рейтингових значень і виконання циклічного процесу. -І се) іме) с 50 - Ф) іме) 60 б5
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP00309114 | 2000-10-17 | ||
| PCT/EP2001/011955 WO2002033596A2 (en) | 2000-10-17 | 2001-10-16 | Method of operating a computer system to perform a discrete substructural analysis |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| UA79231C2 true UA79231C2 (en) | 2007-06-11 |
Family
ID=8173320
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| UA2003043420A UA79231C2 (en) | 2000-10-17 | 2001-10-16 | Method for a discrete substructural analysis and a computer system for realizing the same |
Country Status (23)
| Country | Link |
|---|---|
| US (1) | US20040083060A1 (uk) |
| EP (1) | EP1366440A2 (uk) |
| JP (2) | JP2004512603A (uk) |
| KR (1) | KR20030059196A (uk) |
| CN (1) | CN1264110C (uk) |
| AU (2) | AU2002215028B2 (uk) |
| BG (1) | BG107717A (uk) |
| BR (1) | BR0114987A (uk) |
| CA (1) | CA2423672A1 (uk) |
| CZ (1) | CZ20031090A3 (uk) |
| EA (1) | EA005286B1 (uk) |
| EE (1) | EE200300150A (uk) |
| HR (1) | HRP20030240A2 (uk) |
| HU (1) | HUP0302507A3 (uk) |
| IL (1) | IL155332A0 (uk) |
| MX (1) | MXPA03003422A (uk) |
| NO (1) | NO20031730D0 (uk) |
| PL (1) | PL364772A1 (uk) |
| SK (1) | SK4682003A3 (uk) |
| UA (1) | UA79231C2 (uk) |
| WO (1) | WO2002033596A2 (uk) |
| YU (1) | YU25603A (uk) |
| ZA (1) | ZA200302395B (uk) |
Families Citing this family (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPWO2005069188A1 (ja) * | 2003-12-26 | 2007-07-26 | 大日本住友製薬株式会社 | 化合物および蛋白質間の相互作用を予測するシステム、類似蛋白質または類似化合物を予測するシステム、およびそれらの方法 |
| WO2005091169A1 (en) * | 2004-03-05 | 2005-09-29 | Applied Research Systems Ars Holding N.V. | Method for fast substructure searching in non-enumerated chemical libraries |
| JP2006090733A (ja) * | 2004-09-21 | 2006-04-06 | Fuji Photo Film Co Ltd | 化合物抽出装置およびプログラム |
| EP1762954B1 (en) * | 2005-08-01 | 2019-08-21 | F.Hoffmann-La Roche Ag | Automated generation of multi-dimensional structure activity and structure property relationships |
| JP5512077B2 (ja) * | 2006-11-22 | 2014-06-04 | 株式会社 資生堂 | 安全性評価方法、安全性評価システム及び安全性評価プログラム |
| TW201027376A (en) * | 2008-12-05 | 2010-07-16 | Decript Inc | Method for creating virtual compound libraries within markush structure patent claims |
| CN102043864A (zh) * | 2010-12-30 | 2011-05-04 | 中山大学 | 中药心血管毒性分析的计算机操作方法及其系统 |
| US20140032198A1 (en) * | 2011-04-11 | 2014-01-30 | Jingbo Yan | Application of multidimensional matrix for drug moleculas design and the methodologies for drug molecular design |
| CN102262715B (zh) * | 2011-06-01 | 2013-09-11 | 山东大学 | Bcl-2蛋白抑制剂三维定量构效关系模型的构建方法及应用 |
| ES2392915B1 (es) * | 2011-06-03 | 2013-09-13 | Univ Sevilla | Compuestos bioactivos polifenolicos conteniendo azufre o selenio y sus usos |
| US9946847B2 (en) | 2012-09-22 | 2018-04-17 | Bioblocks Inc. | Libraries of compounds having desired properties and methods for making and using them |
| CN103049674A (zh) * | 2013-01-26 | 2013-04-17 | 北京东方灵盾科技有限公司 | 一种化学药物hERG钾离子通道阻断作用的定性预测方法及其系统 |
| US9424517B2 (en) | 2013-10-08 | 2016-08-23 | Baker Hughes Incorporated | Methods, systems and computer program products for chemical hazard evaluation |
| US9799006B2 (en) | 2013-10-08 | 2017-10-24 | Baker Hughes Incorporated | Methods, systems and computer program products for chemical hazard evaluation |
| US10975412B2 (en) | 2015-05-07 | 2021-04-13 | University Of Kentucky Research Foundation | Method for designing compounds and compositions useful for targeting high stoichiometric complexes to treat conditions, including treatment of viruses, bacteria, and cancers having acquired drug resistance |
| EP3206145A1 (en) * | 2016-02-09 | 2017-08-16 | InnovativeHealth Group SL | Method for producing a topical dermal formulation for cosmetic use |
| WO2018220368A1 (en) * | 2017-05-30 | 2018-12-06 | Gtn Ltd | Tensor network machine learning system |
| US11710543B2 (en) | 2017-10-19 | 2023-07-25 | Schrödinger, Inc. | Methods for predicting an active set of compounds having alternative cores, and drug discovery methods involving the same |
| US12087409B2 (en) | 2018-09-13 | 2024-09-10 | Cyclica Inc. | Method and system for predicting properties of chemical structures |
| WO2020054839A1 (ja) * | 2018-09-14 | 2020-03-19 | 富士フイルム株式会社 | 化合物の合成適性の評価方法、化合物の合成適性の評価プログラム及び化合物の合成適性の評価装置 |
| US11580275B1 (en) * | 2018-12-18 | 2023-02-14 | X Development Llc | Experimental discovery processes |
| EP3712897A1 (en) * | 2019-03-22 | 2020-09-23 | Tata Consultancy Services Limited | Automated prediction of biological response of chemical compounds based on chemical information |
| CN110728078B (zh) * | 2019-11-14 | 2022-11-25 | 吉林大学 | 一种基于胶粘剂化学特性的粘接结构在全服役温度区间下的力学性能的预测方法 |
| CN111354424B (zh) * | 2020-02-27 | 2023-06-23 | 北京晶泰科技有限公司 | 一种潜在活性分子的预测方法、装置和计算设备 |
| CN115335912A (zh) * | 2020-05-14 | 2022-11-11 | 英矽智能科技有限公司 | 逆合成相关合成可行性 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU7311994A (en) * | 1993-05-21 | 1994-12-20 | Arris Pharmaceutical Corporation | A machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics |
| US5463564A (en) * | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
| WO2000049539A1 (en) * | 1999-02-19 | 2000-08-24 | Bioreason, Inc. | Method and system for artificial intelligence directed lead discovery through multi-domain clustering |
| AU4565600A (en) * | 1999-06-18 | 2001-01-09 | Synt:Em (S.A.) | Identifying active molecules using physico-chemical parameters |
-
2001
- 2001-10-16 HR HR20030240A patent/HRP20030240A2/hr not_active Application Discontinuation
- 2001-10-16 CN CNB018207227A patent/CN1264110C/zh not_active Expired - Fee Related
- 2001-10-16 IL IL15533201A patent/IL155332A0/xx unknown
- 2001-10-16 CA CA002423672A patent/CA2423672A1/en not_active Abandoned
- 2001-10-16 WO PCT/EP2001/011955 patent/WO2002033596A2/en not_active Ceased
- 2001-10-16 SK SK468-2003A patent/SK4682003A3/sk not_active Application Discontinuation
- 2001-10-16 AU AU2002215028A patent/AU2002215028B2/en not_active Ceased
- 2001-10-16 HU HU0302507A patent/HUP0302507A3/hu unknown
- 2001-10-16 BR BR0114987-3A patent/BR0114987A/pt not_active Application Discontinuation
- 2001-10-16 US US10/399,329 patent/US20040083060A1/en not_active Abandoned
- 2001-10-16 MX MXPA03003422A patent/MXPA03003422A/es active IP Right Grant
- 2001-10-16 CZ CZ20031090A patent/CZ20031090A3/cs unknown
- 2001-10-16 EA EA200300475A patent/EA005286B1/ru not_active IP Right Cessation
- 2001-10-16 UA UA2003043420A patent/UA79231C2/uk unknown
- 2001-10-16 ZA ZA200302395A patent/ZA200302395B/en unknown
- 2001-10-16 EP EP01983556A patent/EP1366440A2/en not_active Withdrawn
- 2001-10-16 AU AU1502802A patent/AU1502802A/xx active Pending
- 2001-10-16 PL PL01364772A patent/PL364772A1/xx not_active Application Discontinuation
- 2001-10-16 JP JP2002536914A patent/JP2004512603A/ja not_active Withdrawn
- 2001-10-16 EE EEP200300150A patent/EE200300150A/xx unknown
- 2001-10-16 YU YU25603A patent/YU25603A/sh unknown
- 2001-10-16 KR KR10-2003-7005331A patent/KR20030059196A/ko not_active Ceased
-
2003
- 2003-04-10 BG BG107717A patent/BG107717A/bg unknown
- 2003-04-14 NO NO20031730A patent/NO20031730D0/no not_active Application Discontinuation
-
2006
- 2006-12-04 JP JP2006327405A patent/JP2007137887A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| JP2004512603A (ja) | 2004-04-22 |
| WO2002033596A2 (en) | 2002-04-25 |
| ZA200302395B (en) | 2004-03-29 |
| IL155332A0 (en) | 2003-11-23 |
| CA2423672A1 (en) | 2002-04-25 |
| NO20031730L (no) | 2003-04-14 |
| SK4682003A3 (en) | 2003-12-02 |
| US20040083060A1 (en) | 2004-04-29 |
| PL364772A1 (en) | 2004-12-13 |
| AU1502802A (en) | 2002-04-29 |
| CZ20031090A3 (cs) | 2004-01-14 |
| HRP20030240A2 (en) | 2005-02-28 |
| EA200300475A1 (ru) | 2003-10-30 |
| JP2007137887A (ja) | 2007-06-07 |
| BG107717A (bg) | 2004-01-30 |
| AU2002215028B2 (en) | 2007-11-15 |
| MXPA03003422A (es) | 2004-05-04 |
| WO2002033596A3 (en) | 2003-10-02 |
| NO20031730D0 (no) | 2003-04-14 |
| CN1264110C (zh) | 2006-07-12 |
| HUP0302507A2 (hu) | 2003-11-28 |
| BR0114987A (pt) | 2004-02-03 |
| EE200300150A (et) | 2003-08-15 |
| EA005286B1 (ru) | 2004-12-30 |
| HK1061911A1 (en) | 2004-10-08 |
| EP1366440A2 (en) | 2003-12-03 |
| CN1493051A (zh) | 2004-04-28 |
| YU25603A (sh) | 2005-07-19 |
| KR20030059196A (ko) | 2003-07-07 |
| HUP0302507A3 (en) | 2004-05-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| UA79231C2 (en) | Method for a discrete substructural analysis and a computer system for realizing the same | |
| Halperin et al. | Principles of docking: An overview of search algorithms and a guide to scoring functions | |
| Fiser | Template-based protein structure modeling | |
| AU2002215028A1 (en) | Method of operating a computer system to perform a discrete substructural analysis | |
| Fiser | Comparative protein structure modelling | |
| Osakwe et al. | The significance of discovery screening and structure optimization studies | |
| Skjærven et al. | Accounting for conformational variability in protein–ligand docking with NMR-guided rescoring | |
| US11538553B2 (en) | Systems and methods of fragment-centric topographical mapping (FCTM) to target protein-protein interactions | |
| Sprague et al. | CATALYST pharmacophore models and their utility as queries for searching 3D databases | |
| US20020025535A1 (en) | Prioritization of combinatorial library screening | |
| US20030228624A1 (en) | Molecular docking methods for assessing complementarity of combinatorial libraries to biotargets | |
| Plummer | Sequential simplex optimization strategies in agrochemical/drug design | |
| WO2014089359A1 (en) | System for the efficient discovery of new therapeutics drugs | |
| CA2477459C (en) | Comparative field analysis (comfa) utilizing topomeric alignment of molecular fragments | |
| Wu | Development and application of CDOCKER docking methodology | |
| Fiser | Comparative protein structure modelling | |
| Bradshaw | Proteomics today, proteomics tomorrow | |
| Devi et al. | Community Benchmarking Exercises for Docking and Scoring | |
| EP1751669A1 (en) | Computational protein probing to identify binding sites | |
| Fusani | Advancing the use of simulation methods in structure-based drug discovery | |
| Ishida | Development of an AI-Driven Organic Synthesis Planning Approach with Retrosynthesis Knowledge | |
| CA2488411A1 (en) | Process for identifying similar 3d substructures onto 3d atomic structures and its applications | |
| Hu | Systematic Identification of Scaffolds Representing Different Types of Structure-Activity Relationships | |
| Wong | Incorporating Receptor Flexibility into Structure-Based Drug Discovery | |
| Dariusz et al. | Ab Initio server prototype for prediction of phosphorylation sites in proteins |