SK4682003A3 - Method of operating a computer system to perform a discrete substructural analysis - Google Patents
Method of operating a computer system to perform a discrete substructural analysis Download PDFInfo
- Publication number
- SK4682003A3 SK4682003A3 SK468-2003A SK4682003A SK4682003A3 SK 4682003 A3 SK4682003 A3 SK 4682003A3 SK 4682003 A SK4682003 A SK 4682003A SK 4682003 A3 SK4682003 A3 SK 4682003A3
- Authority
- SK
- Slovakia
- Prior art keywords
- chemical
- molecules
- compounds
- fragment
- score
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Computing Systems (AREA)
- Pharmacology & Pharmacy (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Description
Spôsob prevádzkovania počítačového systému na uskutočňovanie diskrétnej subštrukturálnej analýzy
Oblasť techniky
Predložený vynález sa týka počítačového systému a spôsobu jeho prevádzky, ktorý je schopný uskutočňovať diskrétnu subštrukturálnu analýzu. Analýza počíta s uskutočnením počítačom realizovanej identifikácie molekúl, ktoré majú určité vlastnosti, ako napríklad biologickú a/alebo chemickú aktivitu. Počítačom riadená diskrétna subštrukturálna analýza sa môže použiť pri hľadaní liekov alebo v iných oblastiach, kde je cieľom identifikácia biologicky, farmakologicky, toxikologický, pesticídne, herbicídne, katalytický, atď. aktívnych zlúčenín.
Doterajší stav techniky
Pokrok v oblasti napr. medicinálnej chémie závisí na identifikácii biologicky aktívnych molekúl. V mnohých prípadoch sú výskumné programy zameraná na syntézu malých organických molekúl, ktoré budú interagovať so známym enzýmovým alebo receptorovým cieľom, aby poskytli požadovaný farmakologický účinok. Takéto zlúčeniny môžu, aspoň čiastočne, napodobovať alebo inhibovať aktivitu známej, prirodzene sa vyskytujúcej látky, ale sú určené na poskytnutie účinnejšieho a/alebo selektívnejšieho účinku. Zlúčeniny, ktoré sú výsledkom tohto typu výskumu, môžu zahŕňať určité štrukturálne znaky relevantných prirodzene sa vyskytujúcich látok.
Výskumné programy môžu byť založené aj na prirodzene sa vyskytujúcich zlúčeninách nájdených ako výsledok skríningu zdrojov dostupný v prírode, napríklad vzoriek pôdy alebo rastlinných extraktov. Aktívne zlúčeniny objavené týmto spôsobom môžu byť užitočnými tipmi pre program syntetickej chémie.
V súčasnosti existuje zvýšený tlak na identifikáciu nových a užitočných biologicky aktívnych molekúl a dôsledkom toho sa vyvíjajú nové metódy
-2generovania vytipovaných zlúčenín. V tomto ohľade sú výnimočne dôležitými dve vyvinuté metódy, konkrétne kombinačná chémia a vysoko-účinný skríning (HTS).
Kombinačná chémia využíva robotické alebo manuálne techniky na uskutočňovanie viacerých chemických reakcií v malom meradle, pričom pri každej reakcii sa používa iná kombinácia reakčných činidiel, simultánne alebo in parallel, čím sa generujú veľké množstvá rôznych chemických entít na skríning. Zbierka zlúčenín generovaná týmto spôsobom je známa ako knižnica. Knižnice na generovanie nových chemických tipov majú zvyčajne čo najvyššiu diverzitu. Avšak za určitých okolností môžu byť knižnice predpojaté alebo zamerané na konkrétny farmakologický cieľ, alebo upriamené na konkrétnu chemickú oblasť prostredníctvom selekcie reakčných činidiel určených na zavedenie špecifických štrukturálnych znakov do finálnych zlúčenín.
Vysoko-účinný skríning zahŕňa použitie biochemických testov na rýchle testovanie in vitro aktivity veľkých množstiev chemických zlúčenín voči jednému alebo viacerým biologickým cieľom. Tento spôsob je ideálny na skríning veľkých knižníc zlúčenín, ktoré sú generované prostredníctvom kombinačnej chémie.
Napriek nepochybným výhodám kombinačnej chémie a HTS pri generovaní nových štruktúrnych tipov, majú tieto metódy určité nevýhody. Vysoký podiel zlúčenín v nepredpojatých kombinačných knižniciach nemá žiadnu užitočnú aktivitu. Nájdenie užitočných tipov preto závisí na náhode a/alebo počte testovaných zlúčenín. Cielené knižnice majú vyšší podiel aktívnych zlúčenín, ale sú závislé na selekčných kritériách a môžu aj zlyhať pri poskytovaní optimálnych zlúčenín. Okrem toho, obe techniky vyžadujú značné zdroje a experimentálnu kapacitu.
Šanca alebo pravdepodobnosť nájdenia aktívnej molekuly v danom súbore zlúčenín sa môže zvýšiť buď zvýšením celkového počtu testovaných zlúčenín (tzn. veľkosti sád), alebo zvýšením podielu aktívnych zlúčenín v rovnakom súbore. Je možné dokázať, že zvýšenie podielu aktívnych zlúčenín v zbierke zlúčenín je účinnejšie na zvýšenie pravdepodobnosti nájdenia aktívnej molekuly, ako jednoduché zvýšenie celkového počtu zlúčenín, ktoré sú testované. Prvý prístup znižuje počet zlúčenín, ktoré je potrebné vyrobiť a testovať, a je preto aj výhodnejší čo sa týka potrebných zdrojov, napr. na nájdenie biologicky aktívnych molekúl.
-3Subštrukturálna analýza, ako prístup k problému návrhu liekov, je opísaná v Richard D. Cramer III. a ďalší, J. Med. Chem., 17 (1974), strany 553 až 535. Opisuje sa tu, že biologická aktivita molekuly alebo jej akákoľvek iná vlastnosť sa musí vypočítať prostredníctvom kombinácie podielov jej štrukturálnych komponentov (subštruktúr) a ich intra- a intermolekulových interakcií. Podiel danej subštruktúry na pravdepodobnosti aktivity sa môže získať z údajov predtým testovaných zlúčenín obsahujúcich túto subštruktúru. Prvým krokom je príprava tabuľky skúseností so subštruktúrami, ktorá sumarizuje dostupné údaje. Pre každú subštruktúru sa definuje frekvencia aktivity subštruktúry (SAF) ako pomer počtu aktívnych zlúčenín obsahujúci túto subštruktúru k počtu testovaných zlúčenín obsahujúcich túto subštruktúru. SAF sa považuje za reprezentant podielu, ktorý môže mať táto subštruktúra na pravdepodobnosti toho, že zlúčenina je aktívna. Potom sa pre každú zlúčeninu vypočíta aritmetický priemer SAF hodnôt subštruktúr nachádzajúcich sa v tejto zlúčenine.
Hoci táto technika podľa predchádzajúceho stavu techniky umožňuje rozdelenie zlúčenín podľa ich priemerných SAF hodnôt, získanie takejto hodnoty vyžaduje výpočet aritmetického priemeru SAF hodnôt pre každú subštruktúru, ktorá sa nachádza v zlúčenine. Okrem toho, SAF hodnoty potrebné pre tento výpočet sú výsledkom predchádzajúcich výpočtov, ktoré zahŕňajú hodnotenie každej subštruktúry v každej testovanej molekule. Tento prístup preto vedie k významnej počítacej nadbytočnej práci, ktorá zabraňuje tomu, aby sa táto technika aplikovala na väčšie súbory údajov, ktoré sú v súčasnosti dostupné a ktoré by mohli byť použité ako zdroj informácií na uskutočňovanie molekulovej štrukturálnej analýzy. Avšak Cramerova metóda nie je schopná skutočne odhadnúť pravdivý podiel subštruktúry na aktivite.
Preto existuje množstvo ďalších techník chemických štrukturálnych analýz v doterajšom stave techniky danej oblasti.
EP 938 055 A opisuje spôsob vývoja kvantitatívnych vzťahov štruktúry a aktivity na základe údajov generovaných z vysoko účinného skríningu, prostredníctvom identifikácie štrukturálnych vlastností, ktoré robia zlúčeniny aktívnymi. Spôsob je navrhnutý tak, aby sa ustanovil štatistický model biologicky aktívnych zlúčenín, ktorý najprv asociuje rôzne chemické opisy s danou zbierkou
-4zlúčenín, a potom, prostredníctvom použitia podskupiny zlúčenín so známou biologickou aktivitou, trénuje model na predpovedanie toho, či nová zlúčenina bude biologicky aktívna alebo nie.
Sheridan a Kearsley, J. Chem. Inf. Comput. Sci., 35 (1995), strany 310-320, opisujú použitie genetických algoritmov na selekciu podsúboru fragmentov na použitie pri konštruovaní kombinačnej knižnice. Tento spôsob zahŕňa generovanie populácie molekúl z podsúboru molekulových fragmentov a výpočet skóre pre každú molekulu na základe špecifických descriptorov (napr. atómový pár alebo topologická torzia) použitím buď sondy podobnosti, alebo trendovej vektorovej metódy. Použitím genetického algoritmu sa generujú a počítajú ďalšie populácie. Výsledky poskytujú zoznam fragmentov, ktoré sa vyskytujú v molekulách s maximálnym skóre, ktoré môžu byť použité ako základ pre konštruovanie kombinačnej knižnice.
WO 99/26901A1 opisuje spôsob navrhovania chemických látok, ako napríklad molekúl. Zlúčenina pozostáva z lešenia a množstva miest. Metóda začína výberom kandidátskych elementov pre miesta a vytvorením pravdepodobného navrhnutého zoradenia - PAD. Príklad PAD pozostáva z množstva virtuálnych zlúčenín spĺňajúcich určité kombinačné podmienky. Tieto zlúčeniny sa potom syntetizujú a testujú z hľadiska biologickej aktivity. Potom sa uskutočňuje algoritmus na predpovedanie celkovej biologickej aktivity tých zlúčenín, ktoré neboli syntetizované. Na tento účel sa vypočítavajú hodnoty podielu na vlastnosti pre kandidátske elementy, ktoré predstavujú príslušný podiel na aktivite pre každý z jednotlivých elementov. Ďalej sa vypočítava priemerný podiel každej substituentovej skupiny v konkrétnom mieste na biologickej aktivite. Uvedený je príklad, ako vypočítať takýto podiel.
H. Gao a ďalší, J. Chem. Inf. Comput. Sci (39) 1999, 164-168 je článkom opisujúcim aplikáciu QSAR techniky (techniky kvantitatívneho vzťahu štruktúry a aktivity) na problém objavovania liekov. Po tom, ako sa selektujú biologicky aktívne zlúčeniny, optimalizuje sa ich biologická aktivita. Keďže QSAR je založená na hypotetickom vzťahu medzi biologickou aktivitou a molekulovými štruktúrami, technika sa zaoberá identifikáciou štrukturálnych vlastností, ktoré robia zlúčeniny aktívnymi a predpovedaním aktívnych a neaktívnych analógov.
-5WO 00/41060 A1 opisuje spôsob korelácie látkových aktivít so štrukturálnymi znakmi látok. Výraz znak sa týka atómov a väzieb štruktúry, ktoré súhlasia so vzorom. V prvom kroku sa determinujú tí členovia súboru látok, ktorý spĺňajú dané kritériá pre štrukturálne znaky a vlastnosti. Potom sa pre každú aktivitovú kategóriu označia látky, ktoré spadajú do uvedenej kategórie. Po rozdelení súboru látok do niekoľkých aktivitových kategórií sa vypočíta očakávaná aktivita pre akýkoľvek podsúbor a pre každý štrukturálny znak sa skonštruuje súbor aktivita-vlastnosf-znak bitových vektorov, ktoré označujú počet látok obsahujúcich uvedený znak a nachádzajúcich sa v danej aktivitovej kategórii. Dokument sa týka biologických aktivít a zaoberá sa aj objavovaním liekov.
US 6185506 opisuje spôsob selekcie optimálne diverznej knižnice malých molekúl, ktorý je založený na hodnotení molekulových štrukturálnych deskriptorov. Používajú sa multiplicitné súbory údajov z literatúry, ktoré obsahujú rôzne chemické štruktúry a asociované aktivity. Aktivitou môže byť biologická a chemická aktivita. Technika je opísaná v kontexte farmakologických liekov. Okrem toho je opísaná metóda selekcie podsúborov produktových molekúl pre všetky možné produktové molekuly, ktoré by mohli byť vytvorené kombinačnou syntézou zo špecifických reaktantových molekúl a spoločných jadrových molekúl. V časti opisujúcej doterajší stav techniky sa odvoláva na biologicky špecifické knižnice, ktoré boli navrhnuté na základe znalostí o geometrickom usporiadaní štrukturálnych fragmentov abstrahovaných od molekulových štruktúr, o ktorých je známe, že sú aktívne. Je uvedené, že je absolútne nevyhnutné používať menšiu racionálne navrhnutú skríningovú knižnicu, ktorá si však zachová diverzitu zlúčenín dosiahnuteľných kombináciou.
WO 00/49539 A1 opisuje spôsob skríningu súboru molekúl na identifikáciu súborov molekulových znakov, ktoré pravdepodobne korelujú so špecifikovanou aktivitou. Výraz znak sa týka chemických subštruktúr. Súbory molekúl sa usporadúvajú do skupín podľa ich molekulovej štruktúry charakterizovanej prostredníctvom súboru descriptorov. Potom sa skupiny, ktoré reprezentujú vysokú úroveň aktivity, označia a vyhľadajú sa najbežnejšie subštruktúry medzi molekulami v skupinách, ktoré môžu pomerne korelovať s pozorovanou úrovňou aktivity. Ustanoví sa dátový súbor, ktorý reprezentuje tieto molekuly, z počiatočného
-6dátového súboru, ktorý zahŕňa spoločný podsúbor znakov. Technika je opísaná ako odoberanie formy počítačového systému na automatizovanú analýzu dátového súboru.
US 5463564 opisuje počítačovú metódu automaticky generovaných zlúčenín prostredníctvom robotickej syntézy a analýzy množstva chemických zlúčenín. Proces sa uskutočňuje opakovane a jeho cieľom je generovanie chemických entít s definovanými aktivitovými vlastnosťami. Syntetizuje sa riadená diverzitná chemická knižnica, ktorá obsahuje množstvo rôznych chemických zlúčenín. Údaje o štruktúre a aktivite sa získavajú robotickou analýzou syntetizovaných zlúčenín. Opísaných je množstvo databáz, z ktorých každá zahŕňa pole indikujúce ratingový faktor priradený príslušnej zlúčenine. Ratingový faktor sa priraďuje ku každej zlúčenine na základe toho, ako tesne sa aktivita zlúčeniny približuje požadovanej aktivite.
Vyššie opísané metódy sú buď predikčné modely, alebo ešte stále nie sú schopné dostatočne zlepšiť generovanie aktívnych tipov a zvýšiť pravdepodobnosť nájdenia aktívnych zlúčenín v rámci daného súboru zlúčenín. Okrem toho bežné techniky nie sú schopné uspokojiť potrebu vyššieho počtu a kvality molekulových zásahov a tipov, ktoré vstupujú do vývojového potrubia.
Cieľom vynálezu je preto spôsob prevádzkovania počítačového systému a zodpovedajúci počítačový systém, ktorý je schopný zvýšiť šancu nájdenia nových, biologicky a/alebo chemicky aktívnych molekúl.
Podstata vvnálezu
Tento cieľ sa dosiahol tak, ako je nárokované v nezávislých nárokoch.
Výhodné uskutočnenia sú definované v závislých nárokoch.
Jednou výhodou vynálezu je, že je poskytnutý počítačový systém a spôsob prevádzky, ktorý umožňuje zvýšenie podielu aktívnych zlúčenín v danom súbore chemických entít, o ktorých je už známe, že majú požadovanú aktivitu. To sa uskutočňuje aplikovaním techník založených na vedomostiach na identifikáciu nových sérií zásahov a tipov, hlavne budovaním systémov na uskutočňovanie počítačom riadeného objavovania molekúl.
-7Inou výhodou tohto vynálezu je to, že prostredníctvom analýzy databázy, ktorú je možné prehliadať na základe molekulových štruktúr a biologických a/alebo chemických vlastností, sa vylučujú nákladné experimenty. Proces hľadania podľa vynálezu je preto možné racionalizovať, čo zase vedie k menej nákladnému objavovaniu liekov.
Okrem toho vynález výhodne umožňuje rýchlejšie uskutočňovanie vyhľadávacích procesov, aby bolo možné identifikovať tie molekuly, ktoré majú určité požadované vlastnosti, za kratší čas v porovnaní s metódami predchádzajúceho stavu techniky.
Ďalej je vynález výnimočne výhodný v oblasti biochémie. V minulosti poskytlo DNA sekvenovanie, a najmä sekvenovanie genómu, komplexné databázy aminokyselinových sekvencií, ktoré môžu byť použité ako východiskový bod pri uskutočňovaní vynálezu. Potom vynález umožňuje identifikáciu známych a/alebo osamotených ligandov a/alebo párov osamotený ligand-receptor prostredníctvom predpovedania peptidovej sekvencie na základe výsledkov získaných so zoznamom štruktúr analyzovaných z hľadiska biologicky aktívnych chemických determinantov. Po identifikácii v databáze a expresii sa peptidové sekvencie môžu testovať biochemickým testom. Takže vynález výhodne dovoľuje dedukovanie biologických štruktúr prostredníctvom porovnania so zoznamom chemických molekúl, pre ktoré bola determinovaná aktivita voči určitému cieľu, a tak poskytuje identifikačnú (spätnú sekvenčnú) techniku.
Vynález bude teraz opísaný podrobnejšie s odvolaním sa na obrázky na výkresoch.
Prehľad obrázkov na výkresoch
Obrázok 1 je blokovým diagramom ilustrujúcim počítačový systém podľa výhodného uskutočnenia vynálezu.
Obrázok 2 je schémou ilustrujúcou hlavný proces uskutočňovania diskrétnej štrukturálnej analýzy podľa výhodného uskutočnenia vynálezu.
Obrázok 3 je schémou ilustrujúcou proces opätovného opakovania podľa vynálezu.
-8Obrázok 4 je schémou ilustrujúcou proces generovania fragmentovej knižnice podľa výhodného uskutočnenia predloženého vynálezu.
Obrázok 5 je grafom ilustrujúcim to, ako sa môžu selektovať fragmenty na základe vypočítaných hodnôt skóre.
Obrázok 6 je schémou ilustrujúcou spôsob vypočítavania hodnoty skóre pre fragment, podľa výhodného uskutočnenia vynálezu.
Obrázok 7 je schémou ilustrujúcou spôsob analýzy fragmentovej knižnice, keď sa uskutočňuje opätovné opakovanie.
Obrázok 8 je schémou ilustrujúcou spôsob selekcie novej zlúčeniny použitím generických subštruktúr.
Obrázok 9 je schémou ilustrujúcou spôsob generovania subštruktúr na použitie vo virtuálnom skríningu.
Obrázok 10 je schémou ilustrujúcou spôsob analyzovania fragmentovej knižnice, keď sa uskutočňuje opätovné opakovanie, aplikovaním anelačnej techniky podľa výhodného uskutočnenia vynálezu.
Obrázok 11 je príkladom relatívnej kontribučnej mapy na ilustráciu anelačnej techniky aplikovanej v spôsobe podľa obrázku 10.
Obrázok 12 je grafom ilustrujúcim účinok zlúčeniny na receptorom sprostredkované generovanie inozitol trifosfátu.
Obrázok 13 je grafom ilustrujúcim účinok zlúčeniny na kinázovo závislú fosforyláciu proteínu.
Obrázok 14 je grafom ilustrujúcim účinok zlúčeniny na fosfatázovo závislú defosforyláciu proteínu.
Obrázok 15 je grafom ilustrujúcim relatívne kontribučné informácie prostredníctvom zanesenia determinant oproti ich príslušným hodnotám skóre.
Obrázky 16A-H sú ďalšími grafmi ilustrujúcimi relatívnu kontribúciu, ktoré demonštrujú ekvivalenciu funkcií na výpočet skóre.
Príklady uskutočnenia vynálezu
Predložený vynález bude teraz opísaný podrobnejšie. Okrem toho budú výhodné uskutočnenia podľa vynálezu diskutované s odvolaním sa na priložené
-9obrázky na výkresoch. Navyše je poskytnutých množstvo príkladov ako môže byť vynález aplikovaný v rôznych oblastiach objavovania liekov.
Podľa vynálezu sa prevádzkuje počítačový systém na uskutočňovanie subštrukturálnej analýzy. Databáza molekulových štruktúr je dostupná. Databázu je možné prehľadávať na základe molekulových informácií a biologických a/alebo chemických vlastností. Molekulová štrukturálna informácia je akákoľvek informácia vhodná na determinovanie molekulovej štruktúry molekuly. Biologické a/alebo chemické vlastnosti zahŕňajú biochemické, farmakologické, toxikologické, pesticídne, herbicídne a katalytické vlastnosti.
Použitím databázy technika podľa predloženého vynálezu identifikuje podsúbor molekúl, ktoré majú danú biologickú a/alebo chemickú vlastnosť. V uvedenom podsúbore sa potom determinujú fragmenty molekúl. Výraz fragment sa týka akejkoľvek štrukturálnej podjednotky molekuly, vrátane jednoduchých funkčných skupín, dvojrozmerných subštruktúr a ich rodín, jednoduchých atómov alebo väzieb a akejkoľvek zostavy štrukturálnych deskriptorov v dvojrozmernom alebo trojrozmernom molekulovom priestore. Pre priemerného odborníka v oblasti bude zrejmé, že fragmentom môže byť molekulová subštruktúra, ktorá nemá žiadny známy význam v obvyklej chémii.
Potom ako sa molekulové štruktúry v podsúbore rozbijú na fragmenty, vypočíta sa pre každý fragment hodnota skóre, ktorá indukuje podiel príslušného fragmentu na danej biologickej a/alebo chemickej vlastnosti. Takže vynález umožňuje priradenie hodnoty skóre fragmentom na základe existujúcej vedomosti s ohľadom na biologické a/alebo chemické vlastnosti molekúl. V nasledujúcom opise je molekula, štruktúra alebo subštruktúra aktívna, ak má danú vlastnosť. Molekula, štruktúra alebo subštruktúra, ktorá nie je aktívna, sa označuje inaktívna. Takže predložený vynález poskytuje subštrukturálnu analýzu založenú na diskrétnej informácii o biologickej a/alebo chemickej vlastnosti. Hlavný spôsob podľa vynálezu je tu preto označovaný diskrétna subštrukturálna analýza (DSA).
Keďže v súlade s vynálezom sú fragmenty asociované s hodnotami skóre indikujúcimi ich podiel na danej biologickej a/alebo chemickej vlastnosti, môžu sa fragmenty považovať za chemické determinanty zodpovedné za daný biologický a/alebo chemický výstup. Identifikácia fragmentov sa uskutočňuje nasledujúcim
-10súborom logických pravidiel (algoritmom), ktorá je charakteristická pre samotný DSA proces. V tomto kontexte je samotná hodnota skóre funkciou:
a) prevalencie chemického determinantu v podsúbore aktívnych molekúl a
b) prevalencie rovnakého determinantu v celom zozname zlúčenín, ktoré sú posudzované.
Na základe tejto definície potom metóda identifikuje jeden alebo viacero lokálnych extrémov funkcie na výpočet skóre, ktorých zodpovedajúce chemické determinanty predstavujú úplné alebo čiastočné chemické riešenia pre požadovaný biologický výstup. Zistenie najvyšších možných hodnôt, ktoré môže funkcia na výpočet skóre dosiahnuť v akomkoľvek danom súbore údajov, sa rovná identifikácii chemických determinant obsiahnutých v podsúboroch najúčinnejších biologicky aktívnych molekúl, ktoré majú najnižšiu pravdepodobnosť náhodného výskytu v rovnakých podsúboroch.
Vynález bude teraz opísaný s odvolaním sa na obrázky na výkresoch a najmä s odvolaním sa na obrázok 1. Obrázok 1 znázorňuje výhodné uskutočnenie počítačového systému podľa vynálezu. Počítačový systém zahŕňa centrálnu jednotku 100 na spracovanie dát, ktorá môže byť riadená užívateľským rozhraním 105. Jednotkami 100 a 105 môže byť akýkoľvek počítačový systém, ako napríklad pracovná stanica alebo osobný počítač. Výhodne je počítačovým systémom multiprocesorový systém používajúci mutli-úlohový operačný systém.
Centrálna spracovávacia jednotka 100 je spojená s programovou pamäťou 130. v ktorej je uložený realizovateľný programový kód zahŕňajúci inštrukcie na uskutočňovanie DSA procesu podľa vynálezu. Tieto inštrukcie zahŕňajú fragmentačné funkcie 135 na rozbitie molekulových štruktúr na fragmenty, pamäťové funkcie 140 na výpočet hodnôt uložených v pamäti, generalizačné funkcie 145 (napríklad na získanie izomérov) na lokalizáciu generalizovateľných položiek vo fragmentových štruktúrach a nahradenie týchto položiek generalizovanými výrazmi, a tým na generovanie generických subštruktúr, virtuálne skríningové funkcie 150 na uskutočňovanie virtuálneho skríningu a anelačné funkcie 155 na uskutočňovanie fragmentového anelačného procesu podľa vynálezu. Nižšie sú podrobnejšie opísané detaily o jednotlivých funkciách a procesoroch uskutočňovaných v centrálnej spracovávacej jednotke 100.
-11 Centrálna spracovávacia jednotka 100 je ďalej pripojená na databázu štrukturálnej aktivity alebo na zoznam aktivít zlúčenín 115 na prijímanie informácií o molekulovej štruktúre a informácie o biologických a/alebo chemických vlastnostiach. Táto informácia sa podobným spôsobom môže prijímať z jednotky na vstup údajov HO, ktorá umožňuje prístup k externým zdrojom dát.
Prostredníctvom prístupových jednotiek 110 a/alebo 115 sa môže získať podsúbor molekulových štruktúr napríklad z akéhokoľvek dostupného zdroja, akým je privátna alebo verejná databáza, ktorú je možné prehľadávať z hľadiska štrukturálnych a/alebo biologických vlastností. Verejné databázy zahŕňajú, ale nie sú obmedzené na databázy dostupné pod nasledujúcimi označeniami: MDDR, Pharmaprojects, Merck Index, SciFinder, Derwent. Podsúbor molekúl sa môže získať aj syntetizovaním a testovaním zlúčenín. Molekuly budú vo všeobecnosti obsahovať kompletné zlúčeniny, ale môžu byť aj molekulovými fragmentárni. Pre akúkoľvek danú biologickú alebo chemickú vlastnosť obsahuje podsúbor zlúčeniny, ktoré nemajú uvedenú vlastnosť, napríklad zlúčeniny, ktoré nie sú aktívne (alebo nedosahujú daný prah aktivity), ako aj zlúčeniny, ktoré majú uvedenú vlastnosť, napríklad zlúčeniny, ktoré vykazujú požadovanú aktivitu (tzn. majú aktivitu vyššiu ako daný prah). Všetky neaktívne zlúčeniny sú relevantné a preto sa analyzujú.
Po vstupe vnútorných alebo externých dát a uskutočnení DSA procesu použitím funkcií uložených v programovej pamäti 130 je v centrálnej spracovávacej jednotke 100 uložená knižnica fragmentov 120. ktorá obsahuje determinované fragmenty molekúl spolu s asociovanými hodnotami skóre.
V jednom výhodnom uskutočnení predloženého vynálezu je knižnica fragmentov 120 výsledkom hlavného procesu podľa vynálezu. Knižnica fragmentov 120 sa môže použiť, napríklad chemikmi alebo biológmi alebo inžiniermi, ako zdroj hodnotných informácií, ktoré sú využiteľné v akomkoľvek následnom výskumnom procese.
V inom výhodnom uskutočnení je knižnica fragmentov 120 prechodným výsledkom hlavného spôsobu podľa vynálezu a môže byť preto uložená v prechodnej, ako aj neprechodnej pamäti. Knižnica fragmentov 120 podľa tohto uskutočnenia môže byť dekódovaná centrálnou spracovávacou jednotkou 100.
-12pričom sa vykonávajú ďalšie funkcie uložené v programovej pamäti 130, na generovanie zbierky zlúčenín 125.
Zbierka zlúčenín 125 je zbierkou molekúl, o ktorých sa prostredníctvom procesu podľa vynálezu zistilo, že majú požadovanú biologickú a/alebo chemickú vlastnosť, alebo že ju nemajú. Molekuly zbierky zlúčenín 125 môžu byť buď už známymi molekulami, alebo to môžu byť hypotetické štruktúry, ktoré ešte neboli syntetizované. V každom prípade sú molekuly zbierky zlúčenín 125 výsledkom hodnotenia hodnôt skóre priradených fragmentom v súlade s diskrétnou subštrukturálnou analýzou.
Ako je možné vidieť na obrázku 1, centrálna spracovávacia jednotka 100 je dalej spojená s dátovou pamäťou 160, v ktorej sú uložené súbory zlúčenín 165, súbory fragmentov 170 a hodnoty skóre 175. Dátová pamäť 160 je poskytnutá na ukladanie údajov, ktoré sa používajú na ukladanie vstupných parametrov, keď sa vyvolávajú funkcie 135 až 155, alebo na ukladanie návratových hodnôt týchto funkcií.
S odvolaním sa na obrázok 2, ktorý ilustruje výhodné uskutočnenie hlavného DSA procesu, operátor počítačového systému, znázorneného na obrázku 1, najprv vyberie aktivitu v kroku 210. Ako je uvedené vyššie, aktivita znamená akúkoľvek biologickú a/alebo chemickú vlastnosť, vrátane biochemickej, farmakologickej, toxikologickej, pesticídnej, herbicídnej, katalytickej vlastnosti. Okrem toho, keď sa vynález používa na identifikáciu opustených ligandov, aktivitou môže byť daný účinok na cieľový proteín (typicky viazanie).
V predloženom opise môže byť zmienka o konkrétnej vlastnosti, ako napríklad biologickej aktivite, ak z kontextu nevyplýva niečo iné, extrapolovaná na iný typ biologickej aktivity a/alebo chemickej vlastnosti. Okrem toho, na vylúčenie pochybností, môžu v tomto kontexte výrazy „zlúčenina“, „molekula“ a „molekulárna štruktúra“ zahŕňať molekulové subštruktúry, ako aj kompletné zlúčeniny.
Potom, ako sa vyberie aktivita v kroku 210, vyberie sa v kroku 220 súbor zlúčenín 125. Vybraný súbor zlúčenín je súborom molekúl, ktoré sa majú skúmať, aby sa zistilo, ktoré fragmenty sa podieľajú na vybranej aktivite. Ako bude opísané podrobnejšie nižšie, súbor zlúčenín vybraný v kroku 220 zahŕňa molekuly, o ktorých je známe, že sú aktívne, a molekuly, o ktorých je známe, že sú neaktívne.
-13Potom, ako sa vyberie aktivita a súbor zlúčenín, pokračuje proces generovaním knižnice fragmentov 120 v kroku 230. Proces generovania knižnice fragmentov je možné opísať ako proces zvažovania účinnosti molekulových fragmentov v rámci podsúboru známych štruktúr na chemický a/alebo biologický výstup. Tento proces môže byť opísaný ako obsahujúci nasledujúce kroky:
I. identifikáciu jednej alebo viacerých podsád molekúl, ktoré majú dané vlastnosti vo vzťahu k požadovanému chemickému a/alebo biologickému výstupu;
II. generovanie predbežnej knižnice obsahujúcej fragmenty molekúl v uvedenom súbore alebo viacerých súboroch;
III. aplikovanie algoritmu na odhadnutie podielu uvedených fragmentov v súvislosti s požadovaným chemickým a/alebo biologickým výstupom; a
IV. získanie hodnoty skóre pre každý fragment, na ktorý sa aplikoval uvedený algoritmus, pričom táto hodnota skóre môže byť ohraničená rádom veličiny; čím sa tie fragmenty, ktoré sa najpravdepodobnejšie podieľajú na požadovanom chemickom a/alebo biologickom výstupe asociujú, napr. s vysokými hodnotami skóre.
Ako bolo uvedené vyššie, knižnica fragmentov 120 obsahuje fragmenty, ako aj získané hodnoty skóre pre fragmenty. Keď sa už generovala knižnica fragmentov 120 v kroku 230, môže alebo nemusí, sa uskutočniť krok opätovného opakovania 240.
Uskutočňovaním DSA procesu spôsobom opätovného opakovania je možné použiť matematické zdroje veľmi účinným spôsobom. Proces môže napríklad výhodne začať s malými fragmentárni. Keďže počet možných fragmentov v molekulových štruktúrach sa zvyšuje približne exponenciálne s maximálnou veľkosťou fragmentov, ktoré sa skúmajú, táto maximálna veľkosť je nastavená na začiatku na dosť nízku hodnotu, aby bolo možné pracovať aj svetmi vysokým počtom molekulových štruktúr.
Proces podľa krokov 210 až 230 odhaľuje fragmenty s vysokým podielom na požadovanej aktivite. Odhalené fragmenty sa potom môžu použiť v nasledujúcom kole (alebo cykle) na získanie fragmentov s väčšou veľkosťou, tzn. vyššou molekulovou hmotnosťou. Príklad opätovne opakovaného procesu je znázornený na obrázku 3. V prvom kole sa zistilo, že fragment C=O má veľmi vysoký podiel na
-14požadovanej aktivite. Tento fragment sa potom používa na prehľadávanie fragmentov, ktoré majú väčšiu veľkosť ako výsledný fragment prvého kola a ktoré zahŕňajú tento fragment. V príklad podľa obrázku 3 sa v druhom kole ukázalo, že fragment N-C=O je najlepším fragmentom s touto veľkosťou s ohľadom na požadovanú aktivitu. Tento opätovne opakovaný proces potom pokračuje, a tým sa zvyšuje veľkosť fragmentov, a môže viesť ku zlúčenine, ktorá má pravdepodobne požadovanú biologickú a/alebo chemickú vlastnosť a je vhodná na požadovanú aplikáciu.
S odvolaním sa späť na obrázok 2, ak sa v kroku 240 rozhodne o uskutočňovaní nasledujúceho kola alebo cyklu, analyzuje sa knižnica fragmentov 120. generovaná v kroku 230, v kroku 250 a proces sa vracia späť na krok 220. Príklady toho, ako sa knižnica fragmentov 120 analyzuje v kroku 250, budú opísané podrobnejšie nižšie. Ako bude zrejmé, proces opätovného opakovania umožňuje aplikáciu viacerých pokročilých funkcií, ako napríklad generalizačných funkcií 145 a anelačných funkcií 155, na ďalšie zlepšenie procesu skúmania použitím diskrétnej subštrukturálnej analýzy.
Nakoniec, ak sa v kroku 240 rozhodne, že sa nemá uskutočňovať žiadne opätovné opakovanie, alebo ak sa proces opätovného opakovania dostane na koniec, generuje sa v kroku 260 zbierka zlúčenín 125.
Teraz späť ku kroku 230, v ktorom sa generuje knižnica fragmentov 120. S odvolaním sa na obrázky 4 až 6 bude teraz opísané výhodné uskutočnenie podkrokov tohto procesu generovania. Najprv, potom, čo vstúpi interná databáza 115 a/alebo externý zdroj dát a identifikuje sa podsúbor molekúl, v kroku 410 sa príjmu údaje o štruktúre a aktivite súvisiace s identifikovanými molekulami. Potom sa v kroku 420 determinujú fragmenty molekúl v podsúbore.
Molekuly môžu byť fragmentované použitím množstva konvenčných techník. Napríklad môže byť použitý algoritmus na nájdenie akejkoľvek permutácie atómov, ktoré sú vzájomne viazané. Fragmentačné funkcie 135 môžu využiť minimálnu a maximálnu veľkosť fragmentov. Ako iný príklad by mohol byť fragmentačný algoritmus konštruovaný tak, aby preskakoval fragmenty, ktoré majú atómy organizované lineárne. Okrem toho by algoritmus mohol byť projektovaný tak, aby zahŕňal alebo vylučoval určité typy väzieb. Bude existovať veľa rozličných druhov
-15aplikovaných fragmentačných funkcií, ktoré budú bez problémov dostupné skúsenému praktikovi.
Takže každá z molekulových štruktúr môže byť koncepčne rozdelená na série diskrétnych subštruktúr alebo fragmentov (krok 420). Fragmenty môžu byť jednoduchými funkčnými skupinami, napr. NO2, COOH, CHO, CONH2, exaktnými dvojrozmernými subštruktúrami, napr. o-nitrofenol; voľne definovanými rodinami subštruktúr, napr. R-OH; jednoduchými atómami alebo väzbami, alebo akokoľvek zostavou štrukturálnych deskriptorov v dvojrozmernom alebo trojrozmernom chemickom priestore.
Potom ako sa molekuly rozbijú na fragmenty v kroku 420, vypočíta sa fragmentové skóre v kroku 430 prostredníctvom výpočtu hodnoty skóre pre každý fragment a vypočítaná hodnota sa priradí ku fragmentu. Potom sa v kroku 440 determinujú fragmenty s najvyšším skóre a uložia sa v kroku 450.
Príklad toho, ako sa determinujú fragmenty s najvyšším skóre, je znázornený na obrázku 5. V tomto prípade sú determinované hodnoty skóre zaznamenané do grafu oproti počtu zlúčenín, ktoré obsahujú príslušný fragment. V tomto grafe je každý fragment reprezentovaný bodom. Použitie zanesenia do grafu v kroku 440 poskytuje viac informácii ako len výber fragmentov s najvyšším skóre prostredníctvom porovnania hodnôt skóre, keďže graf využíva aj informácie o počte zlúčenín obsahujúcich príslušné fragmenty.
Proces hľadania najväčšej možnej hodnoty skóre môže byť braný ako ekvivalent generovania fylogénneho sita hierarchicky príbuzných molekulových fragmentov zodpovedajúceho danej biologickej a/alebo chemickej aktivite. V takomto usporiadaní sú uzly sita poskytované samotnými fragmentárni a pravdepodobnosť, že akýkoľvek jednotlivý fragment je na základni biologicky aktivity je daná vzdialenosťou zodpovedajúceho uzla od počiatku, to znamená základne samotného sita. Takže čím väčšia je hodnota skóre pre akýkoľvek daný fragment, tým ďalej od počiatku mriežky sa nachádza zodpovedajúci uzol a tým je pravdepodobnejšie, že fragment predstavuje chemické riešenie napr. farmakofór, ktorý je rozoznávaný daným cieľom.
Teraz bude podrobnejšie opísaný krok 430, v ktorom sa určuje skóre fragmentov, s odvolaním sa na obrázok 6. Aplikovanie funkcií na výpočet skóre 140
-16zodpovedá vyššie uvedenému súboru logických pravidiel alebo matematických krokov. DSA spôsob podľa vynálezu zahŕňa vo výhodnom uskutočnení krok začleňovania premenných súvisiacich s prevalenciou každého fragmentu do jednej alebo viacerých matematických funkcií, ktoré odhadujú hodnotu skóre pre akýkoľvek daný fragment.
Uvedený algoritmus je funkciou:
(a) počtu molekúl x v rámci podsúboru, ktoré spĺňajú dané prahové kritéria v súvislosti s požadovaným výstupom, a ktoré obsahujú daný fragment;
(b) počtu molekúl y v rámci daného podsúboru, ktoré obsahujú daný fragment, bez ohľadu na to, či spĺňajú dané prahové kritériá alebo nie;
(c) počtu molekúl v rámci zdaného podsúboru, ktoré spĺňajú dané prahové kritériá, bez ohľadu na to, či obsahujú daný fragment alebo nie; a (d) počtu N všetkých molekúl v podsúbore.
Výstupom uvedeným v bode (a) môže byť akýkoľvek požadovaný parameter súvisiaci s aktivitou zlúčeniny, vrátane, ale bez obmedzenia na biologickú, biochemickú, farmakologickú a/alebo toxikologickú aktivitu. Každá zlúčenina alebo molekula v dátovom súbore sa potom môže analyzovať podľa toho, či má požadovaný parameter, vo vzťahu k danému prahu, ako napríklad vo vzťahu ku konkrétnej úrovni aktivity. Prah môže byť nastavený na akúkoľvek požadovanú úroveň. V nasledujúcom opise sa pod „aktívnou“ zlúčeninou rozumie zlúčenina, ktorá spĺňa požadované prahové kritérium, a pod „inaktívnou“ zlúčeninou sa rozumie zlúčenina, ktorá nespĺňa požadované prahové kritérium. Výrazy nie sú mienené ako vyjadrenie žiadnej absolútnej vlastnosti testovaných zlúčenín.
Podiel daného fragmentu môže byť determinovaný aplikovaním premenných x, y, z a N, miery asociácie alebo funkcie na výpočet skóre 140. Pre priemerného odborníka v oblasti je dobre známe, že existuje mnoho možných mier asociácie, ktoré sa rozdeľujú do troch hlavných kategórií:
Subtraktívne miery: napr. Nx-yz;
Pomerové miery: napr. x(N-y-z-x)/(z-x)(y-x);
Zmiešané miery: napr. (x/z)-(z-x)/(N-z).
Bude zrejmé, že je možné vybrať akúkoľvek mieru asociácie, a že priemerný odborník v oblasti je bez problémov schopný urobiť príslušnú voľbu.
-17Algoritmus aplikovaný v kroku 430 môže preto zahŕňať (pozri obrázok 6):
(i) určenie počtu zlúčenín x v rámci uvedeného podsúboru, ktoré spĺňajú dané prahové kritérium vo vzťahu k požadovanému chemickému alebo biologickému výstupu, a ktoré obsahujú daný chemický determinant (krok 6W);
(ii) určenie počtu zlúčenín y v rámci uvedeného podsúboru zlúčenín, ktoré obsahujú daný chemický determinant, bez ohľadu na to, či spĺňajú uvedené prahové kritérium alebo nie (krok 620):
(iii) určenie počtu zlúčenín z v rámci uvedeného podsúboru zlúčenín, ktoré spĺňajú uvedené prahové kritérium, bez ohľadu na to či obsahujú uvedený chemický determinant alebo nie (krok 630):
(iv) určenie celkového počtu zlúčenín N v rámci podsúboru zlúčenín (krok 640): a (v) aplikovanie miery asociácie na dve alebo viac premenných x, y, za N (krok 650). výhodne tri alebo štyri premenné a najvýhodnejšie na všetky štyri premenné x, y, z a N.
Miera asociácie sa môže aplikovať priamo, na určenie hodnoty skóre zodpovedajúcej podielu daného fragmentu. Avšak výhodne sa miera asociácie vyvíja do funkcie na výpočet skóre, aby sa určila pravdepodobnosť toho, že sa subštruktúra podieľa na výstupe. To uľahčuje jasnejšiu determináciu rozsahu hodnôt skóre získaných pre všetky analyzované fragmenty. Miera asociácie môže byť vyvinutá na funkciu na výpočet skóre prostredníctvom metód dobre známych v oblasti. Napríklad metódy sa môžu vhodne vybrať zo štatistických metód, napr. zo skupiny, ktorá zahŕňa kritickú pomerovú metódu (z); Fisherov exaktný test, Pearsonov test chi-štvorcov; Mantel-Haenzelov test chi-štvorcov; a metódy založené na, ale bez obmedzenia, uskutočňovaní odvodzovania zo smernice krivky a podobne. Avšak môžu byť použité aj iné ako štatistické testy. Takéto metódy zahŕňajú, ale nie sú obmedzené na výpočet a porovnanie exaktných a aproximovaných intervalov dôveryhodnosti, korelácii koeficientov alebo akejkoľvek funkcie obsahujúcej mieru asociácie pozostávajúcej z kombinácie jednej, dvoch, troch alebo štyroch vyššie opísaných premenných x, y, z alebo N.
-18Príklady matematických vzorcov predstavujúcich miery asociácie alebo funkcie na výpočet skóre, ktoré sa môžu využiť v predloženom vynálezu, zahŕňajú:
| G) | x/z | ||
| (II) | x/N | ||
| (III) | Nx-yz | ||
| (IV) | (x/zHy/N) | ||
| (V) | (x/z)-(z-x)/(N-z) | ||
| (VI) | x(N-y-z+x) (z-x)(y-x) | ||
| (VII) | Nx-yz | ||
| 7z(N-z) y(N-y) | |||
| (VIII) | θ[(χ/ζ)-(ζ-χ)/(Ν-ζ)] | ||
| (IX) | (|Nx-yz|-N/2)2N z(N-z) y(N-y) | ||
| (X) | x(N-y-z+x; __ (z-x)(y-x) ® | -2ýl/x+1/(y-x)+1/(z-x)+1/(N-y-z+x) | |
| (XI) | x^N-y- | z1+x1)(z2-x2)(y- | x2) |
| x2(N-y- | -z2+x2)(z1-x1)(y- | Xi) | |
| (XII) | 1 d Ας Vd j=1 | I (Nx-yz)2N ^z(N-z)y(N-y)J |
Priemerný odborník v oblasti bude brať funkciu na výpočet skóre (VII) ako produktový momentový korelačný koeficient súvisiaci so stupňom spoločnej odchýlky medzi dichotómnymi premennými, ktorá nie je explicitne uvedená v uvedenom vzorci.
Priemerný odborník v oblasti bude brať funkciu na výpočet skóre (VII) ako súvisiacu s odhadom rizika rozdielu pomerov použitím smernice regresnej krivky predstavujúcej stupeň spoločnej odchýlky, ktorá existuje medzi dvoma dichotómnymi premennými.
Priemerný odborník v oblasti bude brať funkciu na výpočet skóre (IX) ako štatistickú funkciu súvisiacu s metódou chi-štvorcov modifikovanú pre rôzne mätúce
-19faktory. Napríklad výraz N/2 v čitateli druhej mocniny logaritmovaného súčinu je konzervatívnym nastavením normálnej aproximácie na binomickú distribúciu, ktorá je užitočnou modifikáciou na prácu s relatívne malými hodnotami x, y, z alebo N. Pre priemerného odborníka v oblasti bude zrejmé, že na rovnaký účel je možné použiť iné miery asociačných funkcií a/alebo funkcií na výpočet skóre namiesto tých, ktoré sú opísané vo vzorci (I) a (II), z ktorých najvýznamnejšie v zmysle predloženého vynálezu obsahujú rôzne kombinácie jednej, dvoch, troch alebo štyroch premenných x, y, z a N.
Priemerný odborník v oblasti bude brať funkciu na výpočet skóre (X) ako spôsob, ktorým sa odhaduje hodnota spodného limitu 95% intervalu spoľahlivosti miery (III) použitím logaritmickej transformácie na to, aby bola distribúcia pomeru porovnateľná s normálnou distribúciou, a použitím prvej rádovej Taylorovej sériovej aproximácie na odhadnutie odchýlky logaritmu rovnakého pomeru.
Priemerný odborník v oblasti bude brať funkciu na výpočet skóre (XI) ako spôsob na porovnávanie rozdielu pomerov, umožňujúci identifikáciu chemických determinant, ktoré sú s najväčšou pravdepodobnosťou viac selektívne pre jeden cieľ ako pre druhý.
Priemerný odborník v oblasti bude brať funkciu skóre (XII) ako spôsob na kombináciu multiplicitných testov asociácie, umožňujúci identifikáciu chemických determinant, ktoré majú s najväčšou pravdepodobnosťou vplyv na dve alebo viacero daných vlastností v rovnakom čase.
Pre priemerného odborníka v oblasti bude tiež zrejmé, že funkcia na výpočet skóre sa môže modifikovať tak, aby obsahovala ďalšie premenné týkajúce sa molekulového materiálu, biologických, chemických a/alebo fyzikálno-chemických vlastností. Takéto modifikácie by mohli napríklad zahŕňať, bez obmedzenia, nastavenia na účinnosť, selektivitu, toxicitu, biologickú dostupnosť, stabilitu (metabolickú alebo chemickú) zlúčeniny, možnosť syntézy zlúčeniny, čistotu, komerčnú dostupnosť, dostupnosť príslušných reakčných činidiel na syntézu, náklady, molekulovú hmotnosť, molárnu lámavosť, molekulový objem, logP (vypočítané alebo determinované), počet väzieb akceptujúcich vodíkovú väzbu, počet skupín poskytujúcich vodíkovú väzbu, náboje (parciálne a formálne), protonačné konštanty, počet molekúl obsahujúcich ďalšie chemické kľúče alebo
-20deskriptory, počet rotovateľných väzieb, indexy flexibility, indexy molekulového tvaru, podobnosti pri zoradení a/alebo prekryvové objemy.
Takže napríklad funkcia na výpočet skóre (VII) môže byť ďalej modifikovaná napr. na výpočet molekulovej hmotnosti každého chemického determinantu pri zvážení (MW) nasledovne:
MW-e[(x/2)_(z_x)/(N_z)l
Podobne, funkcia na výpočet skóre (IX) môže byť modifikovaná tak, aby zahŕňala premenné MW a [S], ktoré predstavujú molekulovú hmotnosť daného chemického determinantu, (MW), a počet časov, v ktorých sa rovnaká chemická determinant objaví v podsúbore aktívnych zlúčenín x([S]), nasledovne:
(II)
Score = Loi x_ (iNx-yz|-N/2)2N> [S]’ z(N-z)y(N-y) aby sa v priebehu analýzy zvýhodnila identifikácia čo najväčšej množiny obsahujúcej len biologicky aktívne chemické determinanty.
Výsledky algoritmu v kroku 650 poskytujú hodnotu skóre fragmentu, ktorý sa posudzuje. Kroky 610 až 650 algoritmu sa môžu opakovať pre každý zo zvolených fragmentov v dátach. Potom ako sa vypočítajú hodnoty pre všetky zvolené fragmenty, poskytnú výsledky hodnotu skóre zodpovedajúcu potenciálnej účinnosti každého z fragmentov, ktorý bol analyzovaný. Hodnoty skóre sa môžu zoradiť podľa veľkosti, čím sa tie fragmenty, ktoré sa s najväčšou pravdepodobnosťou podieľajú na danom chemickom a/alebo biologickom výstupe, asociujú napr. s vysokými hodnotami skóre. To umožňuje v kroku 440 identifikáciu jedného alebo viacerých lokálnych extrémov hodnôt funkcie na výpočet skóre, ktorých zodpovedajúce chemické determinanty reprezentujú kompletné alebo čiastočné chemické riešenie požadovaného chemického alebo biologického výstupu. Nájdenie najvyšších hodnôt skóre, ktoré je možné dosiahnuť v akomkoľvek danom súbore údajov, sa rovná identifikácii chemických determinant obsiahnutých v podsúboroch molekúl majúcich požadované vlastnosti, pričom tieto chemické determinanty majú najnižšiu
-21 pravdepodobnosť náhodného výskytu v rovnakých podsúboroch. Ak je požadovanou vlastnosťou daná biologická aktivita, fragmenty alebo chemické determinanty s najvyšším skóre predstavujú biologicky aktívny farmakofór.
Teraz späť k obrázku 2, budú diskutované výhodné uskutočnenia kroku 250. analyzovania knižnice fragmentov 120.
Jeden spôsob analyzovania knižnice fragmentov 120 je znázornený na obrázku 7. Spôsob začína výberom fragmentu v kroku 710 na základe hodnôt skóre determinovaných v predchádzajúcom kole. Potom sa zlúčeniny z predchádzajúceho súboru, ktoré obsahujú vybraný fragment, odvodia v kroku 720. Keďže v kroku 710 sa vybral fragment s vysokým podielom na požadovanej aktivite, zlúčeniny, ktoré sa odvodia v kroku 720, môžu byť považované za aktívne zlúčeniny. Potom, v kroku 730. sa vyberú inaktívne zlúčeniny, buď z predchádzajúceho súboru, alebo z databáz, alebo z akéhokoľvek iného zdroja. Potom sa aktívne a inaktívne zlúčeniny spoja v kroku 740 a vytvorí sa nový súbor zlúčenín. Nový súbor zlúčenín sa potom v kroku 220 vyberie ako súbor zlúčenín na generovanie ďalšieho opakovania na postup v nasledujúcom kole.
Výhodné uskutočnenie kroku 730 bude teraz opísané s odvolaním sa na obrázok 8. Toto uskutočnenie využíva generické subštruktúry na selekciu nového súboru zlúčenín pre nasledujúce kolo.
Spôsob podľa obrázku 8 začína analyzovaním, v kroku 810, štruktúry fragmentu, ktorý bol vybraný v kroku 710. Keď sa použije generický aspekt vynálezu, fragment, ktorý je vybraný v kroku 710, sa môže vybrať prostredníctvom zhodnotenia hodnoty skóre, ktorá sa vypočítala v predchádzajúcom kole. Okrem toho, selekcia fragmentu sa môže urobiť závislou na ďalších faktoroch, ktoré ovplyvňujú vhodnosť fragmentu na to, aby bol východiskovým bodom generalizácie. Táto vhodnosť by mohla byť funkciou počtu atómov alebo väzieb, spôsobu, akým sú atómy viazané, trojrozmernej štruktúry príslušného fragmentu, atď.
Po analyzovaní štruktúry vybraného fragmentu v kroku 810 sa v kroku 820 lokalizuje generalizovaná položka vo fragmentovej štruktúre. Táto položka sa potom nahradí generalizovaným výrazom v kroku 830, čo vedie ku generickej subštruktúre (napr. nájdeniu bio-izosterov). Príkladom je
22Ο*
Fragment
Generická subštaiktúra kde v danom vybranom fragmente sa lokalizovali dve generalizované položky a nahradili sa všeobecnými výrazmi [Ar] a A, kde [Ar] znamená aromatické centrum, a A znamená C alebo S.
Generická subštruktúra generovaná v kroku 830 sa potom použije na uskutočňovanie virtuálneho skríningu na nájdenie nových zlúčenín spadajúcich pod generickú subštruktúru. Výraz „virtuálny skríning“ označuje akýkoľvek skríningový proces, ktorý sa uskutočňuje len s dátami, čím sa vylučuje potreba syntetizovať zlúčeniny. Nové zlúčeniny, ktoré sa odhalia virtuálnym skríningom sa potom použijú na konštrukciu nového súboru zlúčenín v kroku 850, ktorý sa môže použiť v nasledujúcom opakovacom kole.
Ako je možné vidieť na obrázku 9, proces virtuáleho skríningu je možné rozdeliť na intra- a extra-doménové modifikácie fragmentov použitím generických subštruktúr. Intra-doménové modifikácie uskutočňované v kroku 910 zahŕňajú substitúcie, inzercie, delécie a inverzie atómov fragmentu. Vychádzajúc z vyššie uvedeného presného fragmentu a zovšeobecňujúc tento fragment na generickú subštruktúru, sa v nasledujúcom príklade získajú tri rozličné substitúcie:
presná generická substitúcie
-23Extra-doménové modifikácie, uskutočňované v kroku 920, zahŕňajú zmeny v substituentoch fragmentu. Tieto môžu byť náhodné, zámerné, atd.·.
o
ci a o
Cielené súbory zlúčenín sú zbierkami molekúl, ktoré sú založené na modifikáciách jednej alebo viacerých generických subštruktúr:
Cl o
N-Š [Ar] -α-ν-α-[Αγ]
O~f
-24Hoci na obrázku 9 sú kroky uskutočňovania intra- a extradoménových modifikácií znázornené ako uskutočňované v sériách, pre priemerného odborníka v oblasti bude zrejmé, že v rámci vynálezu sa uskutočňuje len jeden z týchto rôznych druhov modifikácií, alebo sa uskutočňujú obe modifikácie v rozdielnom poradí alebo aj paralelne. Treba uviesť, že výsledkom virtuálneho skríningu je diverzná zbierka zlúčenín, ktoré majú vysokú šancu byť aktívne, keďže sú obohatené o subštruktúry asociované s aktivitou.
Hoci v kroku 710 sa vyberá fragment, ktorý tvorí základ na aplikáciu generalizačných funkcií 145 na získanie generickej subštruktúry, podľa iného výhodného uskutočnenia vynálezu sa vyberá väčší počet fragmentov s vysokým skóre na generovanie generických subštruktúr. Napríklad, nasledujúce fragmenty sa ukázali ako majúce veľký podiel na požadovanej aktivite, a môžu byť vybrané v kroku 710.
Tieto vybrané fragmenty sa potom redukujú na generické subštruktúry s vysokým skóre, ako napríklad:
Aromatická
Tieto generické subštruktúry sa potom použijú na virtuálny skríning komerčných databáz alebo spojených zbierok zlúčenín.
Hoci proces opätovného opakovania bol opísaný ako výhodný z matematických dôvodov, keďže je užitočné začínať s malými fragmentárni a zvyšovať veľkosť fragmentov v jednotlivých kolách, a hoci bude ďalej ukázané, že účinnosť skúmania sa môže ešte zvýšiť použitím generických aspektov procesu opätovného opakovania, existuje ešte iný prístup podľa vynálezu na ďalšie zlepšenie procesu diskrétnej subštrukturálnej analýzy podľa vynálezu. Tento ďalší prístup je založený na anelačnej technike, ktorá bude teraz opísaná s odvolaním sa na obrázok 10.
Vo výhodnom uskutočnení podľa obrázku 10 začína krok 250, v ktorom sa analyzuje knižnica fragmentov generovaná v predchádzajúcom kole, krokmi 1010 a 1020. v ktorých sa vyberá prvý a druhý fragment. Oba fragmenty sa vyberajú na základe vypočítaných hodnôt skóre a môžu sa považovať na fragmenty s vysokým podielom.
V nasledujúcom kroku 1030 sa aplikuje anelačná funkcia 155 na spojenie prvého a druhého fragmentu. Spojenie fragmentov znamená definovanie molekulovej štruktúry alebo subštruktúry zahŕňajúcej oba fragmenty. Na tento účel sa môže použiť množstvo rozličných anelačných funkcií 155. Tieto anelačné funkcie
-26sa líšia v konkrétnej implementácii toho, ako zhodnotiť a použiť určité anelačné parametre. Anelačnými parametrami sú napr. (vopred určená) vzdialenosť prvého a druhého fragmentu, trojrozmerná orientácia prvého a druhého fragmentu, počet atómov, ktoré sa dávajú medzi fragmenty, počet väzieb, ktoré sa používajú na spojenie fragmentov, typ väzieb a atómov, atď.
Ďalej, anelačný proces sa výhodne kombinuje s vyššie opísaným generickým aspektom. Ak sa napríklad v krokoch 1010 a 1020 vyberú fragmenty F1 a F2, o ktorých je známe, že majú vysoké hodnoty skóre, anelačná funkcia, ktorá sa vyberie v kroku 1030 a prebieha v kroku 1040. by mohla používať na spojenie fragmentov generický výraz
F1-[G]-F2
Všeobecný výraz [G] je synonymom pre molekulové subštruktúry s danými vlastnosťami a anelačné parametre a závisí na použitej anelačnej funkcii.
Po spojení fragmentov prostredníctvom exaktného alebo generického výrazu, sa v kroku 1040 generuje nový súbor zlúčenín, ktoré zahŕňajú oba fragmenty. Príklad molekuly z nového súboru zlúčenín je znázornený na obrázku 11, ktorý je dvojrozmernou mapou relatívnych podielov ukazujúcou relatívny podiel vo vzťahu k dvom lokálnym koordinátam. Ako je možné vidieť na obrázku 11, existujú dve lokálne maximá ukazujúce hodnoty aproximovaného skóre 1,2 a 1,7 fragmentu F1, respektívne F2.
Anelačný proces je výhodný z dvoch dôvodov. Prvou výhodou je to, že spojením dvoch fragmentov s veľkým podielom na požadovanej aktivite sa môžu získať väčšie molekuly, ktoré využívajú skutočnosť, že obsahujú viac ako jeden fragment s vysokým skóre. Výsledné štruktúry majú preto dobré šance mať ešte vyššiu hodnotu skóre ako je najvyššia hodnota skóre týchto dvoch fragmentov.
Napríklad v štruktúre podľa obrázka 11 zahŕňa výsledná zlúčenina fragmenty s hodnotami skóre 1,2 a 1,7, ale môže viesť k celkovej hodnote skóre pre celú zlúčeninu 2,1. Anelačná technika preto umožňuje nájdenie zlúčenín s ešte vyššou aktivitou.
-27Druhou výhodnou je, že anelačné technika umožňuje vyhnúť sa uviaznutiu matematického procesu na mŕtvom bode. Ako je možné vidieť na obrázku 11, hodnoty relatívneho podielu indikujú dve lokálne maximá. Keď sa uskutočňuje proces opätovného opakovania znázornený na obrázku 3, vychádzajúc z malých fragmentov a zvyšujúc veľkosť fragmentov v každom opakovaní po jednotlivých kolách, môže dôjsť k uviaznutiu na mŕtvom bode, v prípade že je fragment vybraný v jednom z medzikrokov lokalizovaný na lokálnom maxime.
Napríklad, keď sa na konci druhého kola vyberie fragment N-C=O a tento fragment je lokalizovaný na lokálnom maxime, ďalšie kolo nebude úspešné. Ako je opísané vyššie, fragmenty nasledujúceho kola sú výhodne konštruované na základe fragmentu vybraného v predchádzajúcom kole postupným zvyšovaním veľkosti fragmentu. Takže bez ohľadu na to aký atóm sa pridá k vybranému fragmentu, nasledujúce kolo posunie fragment mimo lokálneho maxima. To znamená, že v tomto prípade má akýkoľvek výsledný fragment nižšiu hodnotu skóre ako fragment vybraný v predchádzajúcom kole.
Na zabránenie uviaznutiu na mŕtvom bode sa môže aplikovať anelačné technika prostredníctvom výberu dvoch dobrých fragmentov z predchádzajúceho kola, spojením fragmentov, vypočítaním hodnoty skóre a pokračovaním procesu. To sa môže uskutočňovať periodicky v jednotlivých kolách alebo kedykoľvek, keď sa deteguje uviaznutie na mŕtvom bode.
Hoci vynález bol opísaný použitím množstva výhodných uskutočnení, pre priemerného odborníka v oblasti je zrejmé, že týmito uskutočneniami nie je v žiadnom prípade limitovaný. Napríklad je možné meniť poradie procesných krokov znázornených na schémach, alebo kroky znázornené ako uskutočňujúce sa za sebou, sa môžu uskutočňovať paralelne, pozri napr. kroky 1010 a 1020 procesu znázorneného na obrázku 10.
Okrem toho je pre priemerného odborníka v oblasti zrejmé, že nie všetky zo znázornených spôsobových krokov sú potrebné pri každej implementácii. Napríklad v procese určovania skóre na obrázku 6 nie je potrebné vypočítavať parametre, ktoré nie sú používané funkciou na výpočet skóre. Okrem toho, parametre by sa mohli vypočítavať paralelne použitím multi-úlohového alebo multi-spôsobového operačného systému.
-28Ďalšie uskutočnenia vynálezu budú teraz opísané ako príklady.
Napríklad, knižnica fragmentov generovaná v kroku 230 môže teoreticky obsahovať všetky možné fragmenty a ich kombinácie. To sa môže v praxi dosiahnuť, ak knižnicu generuje počítač. Avšak, ak je knižnica generovaná manuálne, je pravdepodobné, že obsahuje len výber všetkých možných fragmentov. Spôsob môže byť preto opakovaným použitím kombinácií fragmentov, najmä kombinácií fragmentov, pre ktoré sa v predchádzajúcej analýze získali vysoké hodnoty skóre.
Takže po počiatočnej analýze fragmentov sa môžu tie fragmenty, ktoré sa s najväčšou pravdepodobnosťou podieľajú na požadovanom chemickom a/alebo biologickom výstupe, spojiť a môže sa aplikovať vyššie opísaný algoritmus na odhad podielu spojeného fragmentu na požadovanom chemickom a/alebo biologickom výstupe. Získaná hodnota skóre sa môže porovnať s hodnotami skóre pre jednotlivé fragmenty, aby sa overilo to, či kombinácia vedie k zlepšeniu podielu na požadovanom chemickom a/alebo biologickom výstupe.
V ďalšom uskutočnení podľa predloženého vynálezu je možné vyčleniť spoločnú štrukturálnu časť fragmentov majúcich najvyšší podiel na požadovanom chemickom a/alebo biologickom výstupe, aby sa identifikovalo, či je podiel tejto spoločnej časti rovnaký alebo vyšší ako podiel východiskových fragmentov.
Fragmenty s najvyššími hodnotami skóre, predstavujú chemický determinant alebo molekulový otlačok prsta s najväčšou dôležitosťou pre podiel na danom chemickom alebo biologickom výstupe.
Po identifikácii uvedeného otlačku prsta je možné vytvoriť knižnicu zlúčenín obsahujúcu uvedený chemický determinant(determinanty). Zlúčeniny sa môžu získať programom syntézy na základ skúmaného štrukturálneho znaku. Alternatívne sa môžu identifikovať zlúčeniny obsahujúce chemický determinant z komerčných katalógov a môžu sa kúpiť z relevantného zdroja. Zlúčeniny nemusia byť nevyhnutne pripravené na farmaceutické účely a môžu byť dostupné z rôznych zdrojov.
Po zostavení požadovanej knižnice je ju možné skrínovať z hľadiska daného cieľa (cieľov). Výsledky skríningu môžu identifikovať zlúčeniny, ktoré sú dostatočne aktívne na ďalší vývoj, alebo môžu poskytnúť typy na programovú syntézu. DSA
-29metóda podľa predloženého vynálezu umožňuje vytvorenie diverzných, hoci vysoko špecializovaných knižníc, vo vzťahu ku konkrétnemu biologickému alebo farmakologickému cieľu. Takže pravdepodobnosť úspechu pri skríningu na aktívne zlúčeniny a/alebo užitočné typy je oveľa vyššia.
V ďalšom uskutočnení predložený vynález poskytuje spôsob identifikácie molekúl, ktoré majú určité požadované vlastnosti, ako napríklad biologicky aktívnych molekúl, ktorý zahŕňa:
- zváženie podielu molekulových fragmentov, v rámci podsúboru molekúl, na danom chemickom alebo biologickom výstupe, ako bolo opísané vyššie,
- identifikáciu jedného alebo viacerých fragmentov s najvyššou závažnosťou, a
- kompiláciu súboru zlúčenín, ktoré obsahujú jeden alebo viacero z uvedených fragmentov, a voliteľne
- testovanie uvedených zlúčenín z hľadiska požadovaných vlastností.
Bude zrejmé, že spôsob môže byť rovnako použitý na identifikáciu fragmentov, ktoré vedú k neželaným vlastnostiam, napr. nežiadúcim biologickým vedľajším účinkom, a tým je možné vylúčiť zlúčeniny obsahujúce tieto fragmenty z ďalšieho uvažovania.
Takže spôsob podľa predloženého vynálezu generuje štrukturálne hypotézy (fragmenty), ktorých pravdepodobnosť, že sú vysvetlením daného biologického, biochemického, farmakologického alebo toxikologického výstupu sa odhaduje výpočtom kvantitatívnej hodnoty skóre. Zvažovanie hodnoty skóre pre daný fragment umožňuje vývojárom liekov robiť informované rozhodnutia o tom, ktorý prístup najpravdepodobnejšie vedie k požadovanému cieľu, ako napríklad identifikácii účinnejších zlúčenín, objaveniu novej série aktívnych zlúčení, identifikácii selektívnejších alebo biologicky dostupnejších zlúčenín alebo k eliminácii toxických účinkov.
Spôsob podľa predloženého vynálezu sa zameriava na fragmenty prítomné vpodsúbore daných zlúčenín, a tým eliminuje potrebu uskutočňovať únavné výpočty pre veľké, ale pravdepodobnejšie menej relevantné sektory chemického priestoru. To vedie k redukcii počtu matematických krokov, ktoré sú potrebné na adresovanie daného biologického výstupu, pričom sa zachováva základná hladina
-30molekulového pochopenia, ktoré je potrebné na postulovanie existencie biologicky aktívnych chemických determinantov.
Ako bolo diskutované vyššie, spôsob podľa vynálezu zahŕňa prehľadávanie z hľadiska lokálnych extrémov jednej alebo viacerých funkcií, ktoré je možné jednoducho vybrať tak, aby zodpovedali pravdepodobnostiam uvedeným v bežných štatistických tabuľkách. To poskytuje elegantný spôsob hodnotenia potenciálneho podielu daného fragmentu na chemickom alebo biologickom výstupe. Avšak na uskutočňovanie vynálezu nie je nevyhnutné založiť analýzu na štatistickej teórii.
DSA spôsob podľa vynálezu môže byť použitý v širokom rozsahu aplikácií pri skúmaní liekov. Ako bolo opísané vyššie, spôsob umožňuje identifikáciu farmakofórov, ktoré majú vysokú pravdepodobnosť podielu na danej biologickej aktivite, napríklad, antagonistov 7-TM receptora, kinázových inhibítorov, fosfatázových inhibítorov, blokátorov iónových kanálov a proteázových inhibítorov, ako aj aktívnych skupín prirodzene sa vyskytujúcich peptidergických ligandov.
Spôsob umožňuje aj identifikáciu endogénnych modulátorov liekových cieľov, uľahčovanie identifikácie nových osí farmakologickej intervencie, ako aj racionálne začlenenie nových farmakologických vlastností do molekúl, ktoré predtým nezahŕňali takéto vlastnosti.
Spôsob môže byť využívaný aj na identifikáciu falošne pozitívnych a falošne negatívnych výsledkov v dátových súboroch, napríklad súboroch odvodených na základe vysoko účinného skríningu. DSA sa môže použiť aj na predpovedanie selektivity zlúčeniny, napríklad identifikáciou potenciálne neželateľných sekundárnych účinkov.
Metóda môže byť rovnakým spôsobom použitá na predpovedanie toxických účinkov zlúčeniny prostredníctvom identifikácie jej „toxikofórových“ chemických determinantov, ktoré v spojitosti s vyššie uvedeným, umožňujú konštrukciu chemických determinantových databáz, ktoré majú veľké využitie na selekciu chemických sérií. V tomto kontexte spôsob ďalej umožňuje racionálne začlenenie nových farmakologických vlastností do chemických zlúčenín, ktoré predtým nezahŕňali takéto aktivity. Nakoniec, a prostredníctvom svojej schopnosti identifikovať najvhodnejšiu úroveň molekulovej diverzity, ktorá sa musí testovať v priebehu skríningovej kampane, DSA metóda umožňuje účinné uskutočňovanie
-31 racionálnych, masívne paralelných, automatizovaných vysoko výkonných skríningových kampaní, čo je značné zlepšenie oproti súčasným HTP prieskumným stratégiám.
Bude zrejmé, že vo vyššie uvedenom spôsobe sa aspoň jeden krok uskutočňuje prostredníctvom počítačom kontrolovaného systému. Takže, napríklad hodnoty x, y, za N, získané z databázy (databáz), môžu vstupovať do a byť spracovávané vhodne programovaným počítačom. Predložený vynález preto zahŕňa aj takéto počítačom riadené alebo počítačom implementované metódy.
Z vyššie uvedeného opisu je zrejmé, že predložený vynález poskytuje nový spôsob na rýchlu identifikáciu molekúl, ktoré majú určité požadované vlastnosti, ako napríklad biologicky aktívnych molekúl. Vynález sa konkrétne týka spôsobu zvažovania účinnosti molekulových štruktúr, aby sa identifikovali biologicky aktívne časti molekulových štruktúr, a použitia týchto častí v návrhu špecializovaných zbierok chemických zlúčenín na rýchlejšie a menej nákladné hľadanie liekov.
Spôsob je poskytnutý na zvýšenie podielu biologicky aktívnych zlúčenín v danom súbore chemických entít, pričom o daných zlúčeninách už je známe, že majú požadovanú biologickú aktivitu. Uvedený spôsob zahŕňa aplikáciu rôznych matematických techník na determináciu kvantitatívnych vzťahov štruktúry a aktivity (QSAR). Táto nová metóda, ktorá môže byť označená ako diskrétna subštrukturálna analýza (DSA) poskytuje napr. riešenie problému rozoznávania farmakologického vzoru, teda problému identifikácie chemických determinant (CDs), ktoré sú zodpovedné, čo sa týka danej zlúčeniny, za akýkoľvek daný chemický alebo biologický výstup, ktorým môže byť napríklad biologická, biochemická, farmakologická, chemická a/alebo toxikologická aktivita.
Spôsob podľa predloženého vynálezu má širokú aplikovateľosť a nie je obmedzený na farmaceutickú oblasť. Vo vzťahu k biologicky aktívnym zlúčeninám sa spôsob môže použiť napríklad v spojitosti s pesticídmi a herbicídmi, pričom požadovanou vlastnosťou je príslušná pesticídna a herbicídna aktivita. Spôsob môže byť použitý aj na reakčné modelingové aplikácie, kde požadovanými vlastnosťami sú chemické a nie biologické atribúty, napr. pri príprave katalyzátorov.
Bude zrejmé, že technika podľa vynálezu kombinuje v rámci podsúboru alebo medzi rôznymi podsúbormi tie fragmenty, ktoré sa s najväčšou
-32pravdepodobnosťou podieľajú na požadovanom chemickom a/alebo biologickom výstupe, a aplikuje algoritmus na odhadnutie podielu uvedeného spojeného fragmentu vo vzťahu k požadovanému chemickému a/alebo biologickému výstupu, pričom sa získaná hodnota skóre porovnáva s hodnotami skóre jednotlivých fragmentov, aby sa overilo, či kombinácia vedie k zlepšeniu podielu na požadovanom chemickom a/alebo biologickom výstupe.
Ďalej vynález umožňuje vybranie spoločnej štrukturálnej časti z fragmentov, ktoré majú najväčší podiel na požadovanom chemickom a/alebo biologickom výstupe, aby sa identifikovalo, či podiel uvedenej spoločnej časti je rovnaký alebo vyšší ako podiel východiskových fragmentov.
Okrom toho sa používa miera asociácie, ktorá je výhodne vybraná zo subtraktívnych mier, pomerových mier alebo zmiešaných mier. Miera asociácie je výhodne začlenená, alebo vyvinutá do funkcie na výpočet skóre. Funkcia na výpočet skóre sa môže vyvinúť použitím štatistickej metódy vybranej zo skupiny, ktorá obsahuje metódu kritického pomeru, Fisherov exaktný test, Pearsonovu metódu chi-štvorcov, Mantel Haenzelovu metódu chi-štvorcov, rozhranie sklonov a podobne. V inom výhodnom uskutočnení sa funkcia skóre vyvinie použitím metódy vybranej zo skupiny, ktorá zahŕňa výpočet a porovnávanie exaktných a aproximovaných intervalov dôveryhodnosti, korelačné koeficienty alebo akúkoľvek funkciu explicitne obsahujúcu mieru asociácie zahŕňajúcu akúkoľvek kombináciu jednej, dvoch, troch alebo štyroch z premenných x, y, z a N.
Výhodne vynález uskutočňuje krok výberu molekúl obsahujúcich fragmenty s najvyšším hodnotením ako potenciálne ligandy a voliteľne ich následné testovanie alebo modulátorov liekového cieľa. Proces podľa vynálezu sa môže výhodne použiť na identifikáciu falošne pozitívnych a/alebo falošne negatívnych experimentálnych výsledkov. Iné výhodné aplikácie sú určené na uskutočňovanie prieskumov na podobnosť, analýzy diverzity a/alebo konformačnej analýzy.
Nasledujúce príklady sú poskytnuté na ukázanie početných aplikácii DSA procesu podľa vynálezu. Príklady sú výhodnými uskutočneniami vynálezu a slúžia na ilustráciu vynálezu, ale nie sú považované za limitujúce rozsah.
-33Príkladv uskutočňovania vynálezu
Príklad 1
Racionálna identifikácia nových a selektívnych receptorových ligandov
Použitím rekombinantného membránového prípravku a rádioaktívne značeného peptidu sa vyvinul kompetičný väzobný test pre bunkový povrchový receptor. Zostavila sa zbierka zlúčenín na testovanie v teste, testovala sa a spôsobom podľa predloženého vynálezu sa identifikovali nové receptorové ligandy. Prvý krok spočíval v kompilácii zoznamu 208 štruktúr antagonistov rovnakého receptora prostredníctvom revidovania súčasnej vedeckej literatúry. Druhý krok spočíval v identifikácii biologicky aktívnych chemických determinantov obsiahnutých v týchto 208 receptorových ligandoch. Týmto spôsobom sa generoval ďalší zoznam obsahujúci 101130 štruktúr opísaných ako nemajúcich žiadny vplyv na uvedený receptor a pridal sa k prvému zoznamu. Výsledný zoznam 101338 štruktúr sa potom analyzoval z hľadiska prítomnosti biologicky aktívnych chemických determinantov výberom subtraktívnej miery asociácie (I), kde x znamená počet aktívnych chemických štruktúr obsahujúcich daný chemický determinant, y znamená celkových počet chemických štruktúr obsahujúcich rovnaký chemický determinant, z znamená celkový počet aktívnych chemických štruktúr v súbore N molekúl (tzn. z = 208) a N znamená celkový počet chemických štruktúr podrobených analýze (tzn. N = 101338).
(I) Nx - yz
Miera asociácie (I) sa potom vyvinula na funkciu na výpočet skóre (II), o ktorej bude priemernému odborníkovi v oblasti zrejmé, že je nepriamou mierou pravdepodobnosti náhodného výskytu, modifikovanou pre rôzne mätúce faktory. Napríklad výraz N/2 v čitateli druhej mocniny logaritmovaného súčinu je konzervatívnym nastavením normálnej aproximácie na binomickú distribúciu, ktorá je užitočnou modifikáciou na prácu s relatívne malými hodnotami x, y, z alebo N. Premenné MW a [S], ktoré predstavujú molekulovú hmotnosť daného chemického
-34determinantu (MW), a počet časov, kedy sa rovnaký chemický determinant objaví v podsúbore aktívnych zlúčenín x ([S]), sa začlenili do funkcie na výpočet skóre, aby sa v najvyššej možnej miere podporila identifikácia množiny obsahujúcej jeden druh prvkov, biologicky aktívnych chemických determinantov, v priebehu analýzy. Pre priemerného odborníka v oblasti bude zrejmé, že na rovnaký účel je možné použiť iné miery asociácie a/alebo funkcie na výpočet skóre namiesto funkcií opísaných vo vzorcoch (I) a (II), pričom najvhodnejšie z nich, v zmysle predloženého vynálezu, obsahujú rôzne kombinácie dvoch, troch alebo štyroch premenných x, y, z a N.
(N)
Skóre = Log MW · — ·
Pre priemerného odborníka v oblasti bude tiež zrejmé, že funkcia na výpočet skóre sa môže modifikovať tak, aby obsahovala ďalšie premenné týkajúce sa molekulového materiálu, biologických, chemických a/alebo fyzikálno-chemických vlastností. Takéto modifikácie by mohli napríklad zahŕňať, bez obmedzenia, nastavenia na účinnosť, selektivitu, toxicitu, biologickú dostupnosť, stabilitu (metabolickú alebo chemickú) zlúčeniny, možnosť syntézy zlúčeniny, čistotu, komerčnú dostupnosť, dostupnosť príslušných reakčných činidiel na syntézu, náklady, molekulovú hmotnosť, molárnu lámavosť, molekulový objem, logP (vypočítané alebo determinované), počet väzieb akceptujúcich vodíkovú väzbu, počet skupín poskytujúcich vodíkovú väzbu, náboje (parciálne a formálne), protonačné konštanty, počet molekúl obsahujúcich ďalšie chemické kľúče alebo deskriptory, počet rotovateľných väzieb, indexy flexibility, indexy molekulového tvaru, podobnosti pri zoradení a/alebo prekryvové objemy.
Analýza 101338 štruktúr viedla k identifikácii ôsmych rôznych chemických determinantov s molekulovou hmotnosťou v rozsahu 150 až 230 Da, pri ktorých bola pravdepodobnosť, že sa v podsúbore chemických štruktúr nachádzajú náhodou, menšia ako 1:10000 (p < 0,0001). V súlade s tým sa osem chemických determinantov akceptovalo ako reprezentatívnych pre jednu alebo viacero biologicky aktívnych skupín 208 receptorových ligandov odvodených z literatúry a
-35zostavili sa do štvrtého zoznamu. Potom sa opakovali výpočty použitím vzorca (II), aby sa určilo, či môže byť identifikovaný väčší chemický determinant, ktorý by bol výsledkom kombinácie alebo ďalšej expanzie ktoréhokoľvek z týchto ôsmych fragmentov. Najväčší, štatisticky významný, chemický determinant nájdený týmito ďalšími výpočtami mal molekulovú hmotnosť 335 Da a bol vybraný ako reprezentatívny skelet, alebo farmakologicky aktívny “fingerprint” (otlačok presta) na následnú selekciu a syntézu zlúčenín. Tretí krok procesu zahŕňal použitie vyššie opísanej reprezentatívnej kostry, ako templátu pre vituálny skríning a selekciu zlúčenín. Týmto spôsobom sa uskutočňovali subštrukturálne prieskumy databázy s viac ako 600000 komerčne dostupnými zlúčeninami, použitím tak vypočítaného fingerprintu, ako aj jeho fragmentov. Celkovo sa získalo 1360 zlúčenín na základe týchto prieskumov, a ďalších 1280 zlúčenín sa vybralo náhodne a zadovážili sa od rovnakých dodávateľov na kontrolné účely.
Štvrtý a piaty krok, predstavujúce finálne fázy procesu, sa uskutočňovali paralelne. Štvrtý krok zahŕňal testovanie dvoch súborov zlúčenín opísaných vyššie vo väzobnom teste s rádioaktívne značenými ligandami. Z 1360 molekúl, vybraných na základe reprezentatívneho skeletu, vykazovalo 205 molekúl kompetitívnu aktivitu, keď sa testovali v koncentráciách v rozsahu od 1 do 10 μΜ, 21 zlúčenín vykázalo aktivitu, keď sa testovali v koncentráciách v rozsahu od 0,1 do 1 μΜ, a jedna zlúčenina, označená ako zlúčenina A, vykazovala afinitu voči recpetoru (Ki) s hodotou 8,1 +/- 1,05 nM (n = 12). Žiadna z 1280 náhodne vybraných zlúčenín nedemonštrovala receptor viažuce vlastnosti, keď sa testovala v koncentrácii 10 μΜ. Takže súbor zlúčenín kompilovaný na základe reprezentatívneho fingerprintu bol najmenej 21-násobne účinnejší pri poskytoaní aktívnych molekúl, ako súbor náhodných zlúčenín (p < 0,0001).
Zistilo sa, že zlúčenina A predstavuje novú, doteraz nepublikovanú, triedu inhibítorov daného receptora. Obrázok 12 ilustruje účinok zlúčeniny A na receptorom sprostredkované generovanie inozitol trisfosfátu. Bunky exprimujúce daný receptor, sa vopred naplnili rádioaktívne značeným inozitolom, a vystavili sa receptorovému agonistovi v prítomnosti zvyšujúcich sa koncentrácií zlúčeniny A. Generovanie inozitol trisfosfátu (IP3) sa meralo sledovaním eluovania rádioaktívne značených bunkových inozitol fosfátov z afinitnej kolóny. Zlúčenina A inhibovala
-36agonistom indukované generovanie IP3 s IC5o 22nM, čo je hodnota súhlasiaca s afinitou zlúčeniny voči receptoru.
Ako znázorňuje obrázok 12, zlúčenina A významne redukovala receptorom sprostredkované generovanie inozitol trisfosfátu v bunkovom funkčnom teste (IC50 = 22 nM), čo je zistenie, ktoré je v súlade tak s afinitou zlúčeniny voči receptoru, ako aj s použitím receptorových antagonistov na vyššie opísané výpočty. Nakoniec, zlúčenina A sa determinovala ako vysoko selektívna voči danému receptoru, keďže nebola schopná demonštrovať významnú inhibičnú aktivitu, keď sa testovala v koncentrácii 10 μΜ vo viac ako 20 iných receptorových väzobných testoch s rádioaktívne značeným ligandom.
Piaty krok spočíval v použití vyššie opísaného reprezentatívneho skeletu na priamy koncepčný dizajn a syntézu nových chemických zlúčenín v zmysle riešeného problému a z pohľadu identifikácie nových molekúl s receptor-viažucimi aktivitami. Týmto spôsobom sa zostavil zoznam chemických reaktantov a reakčných produktov, pričom vyššie opísaný biologicky aktívny reprezentatívny skelet, alebo jeho fragmenty, boli obsiahnuté buď v chemických štruktúrach reaktantov, alebo vo výslednom reakčnom produkte (produktoch). Vybralo sa viac ako 2000 kombinácií reaktantov a syntetizovali sa zodpovedajúce reakčné produkty na testovanie. Testovanie týchto zlúčenín v receptor viažucom teste viedlo k identifikácii novej triedy chemických zlúčenín v zmysle riešenej úlohy, z ktorých množstvo reprezentatov vykazovalo IC50 v rozsahu 50 až 500 nM.
Príklad 2
Racionálna identifikácia nových a selektívnych kinázových inhibítorov
Vyvinul sa enzymatický test pre ľudskú kinázu podieľajúcu sa na zápale, pre ktorú neboli predtým v literatúre opísané žiadne inhibítory. Zostavila sa zbierka zlúčenín na testovanie v teste, testovala sa a v súlade so spôsobom podľa predloženého vynálezu sa identifikovali nové kinázové inhibítory. Prvý krok spočíval v kombilácii zoznamu 2367 chemických štruktúr inhibítorov proteínov viažucich purínové nukleotidy z vedeckej literatúru, vrátane štruktúr zlúčenín vykazujúcich inhibíciu iných kináz, fosfodiesteráz, receptorov viažucich purínové nukleotidy a
-37purínovými nukleotidmi modulovaných iónových kanálov, tu označované ako “náhradné ciele”. Druhý krok spočíval v identifikácii biologicky aktívnych chemických determinantov obsiahnutých v týchto 2367 chemických štruktúrach. Týmto spôsobom sa generoval ďalší zoznam obsahujúci 98971 štruktúr, ktoré boli opísané ako nemajúce vplyv na uvedené náhradné ciele, a pridal sa k prvému. Výsledný zoznam 101338 štruktúr sa analyzoval na prítomnosť biologicky aktívnych chemických determinant prostredníctvom selekcie pomernej miery asociácie (III), kde x znamená počet aktívnych chemických štruktúr obsahujúcich daný chemický determinant, y znamená celkových počet chemických štruktúr obsahujúcich rovnaký chemický determinant, z znamená celkový počet aktívnych chemických štruktúr v súbore N molekúl (tzn. z = 2367) a N znamená celkový počet chemických štruktúr podrobených analýze (tzn. N = 101338).
(III) x(N-y-z+x) (z-x)(y-x)
Miera asociácie (II) sa potom vyvinula na funkciu na výpočet skóre (IV), pričom pre priemerného odborníka v oblasti bude zrejmé, že ide o spôsob, ktorým sa odhaduje hodnota spodného limitu 95% intervalu dôveryhodnosti miery (III) použitím logaritmickej transformácie, ktorá robí distribúciu pomeru porovnatefnejšou s normálnou distribúciou, a použitím prvej rádovej Taylorovej sériovej aproximácie na odhadnutie odchýlky logaritmu rovnakého pomeru. V tomto prípade sa nepoužili žiadne ďalšie premenné okrem x, y, z alebo N vo funkcii na výpočet skóre, hoci pre priemerného odborníka v oblasti bolo jasné, že vzorec (IV) sa môže modifikovať tak, aby zahŕňal ďalšie premenné týkajúce sa molekulového materiálu, biologických, chemických a/alebo fyzikálno-chemických vlastností, ako je uvedené, ale bez obmedzenia na vlastnosti uvedené v príklade 1. Pre priemerného odborníka v oblasti bude tiež zrejmé, že iné miery asociácie a/alebo funkcie na výpočet skóre sa môžu použiť na rovnaký účel namiesto tých, ktoré sú opísané vo vzorcoch (III) a (IV), z ktorých najrelevantnejšie pre predložený vynález obsahujú rôzne kombinácie dvoch, troch alebo štyroch z premenných x, y, z a N.
-38(IV) Skóre - X(N y z+xA~2^1/x+1/(v~x)+1/(z~x)+1/(n~v~z+x) (z-x)(y-x)
Analýza 101338 chemických štruktúr anotovaných pre rôzne biologické aktivity sa uskutočňovala výpočtom skóre pre série chemických determinantov so vzorcom (IV), pokiaľ nebola určená jedna alebo viacero skupín determinantov ako obsahujúce elementy s hodnotou vyššou ako hodnota zodpovedajúca pravdepodobnosti 1 ku 20, že sa element v podsúbore biologicky aktívnych štruktúr nachádza náhodne (p < 0,05). V súlade s tým sa tieto chemické determinanty akceptovali ako reprezentatívne pre jednu alebo viacero farmakologicky aktívnych skupín inhibítorov náhradných cieľov opísaných v literatúre a zostavili sa do štvrtého zoznamu. V protiklade s prehľadávaním kombinácií týchto determinantov s maximálnym skóre opísaným v príklade 1, štruktúry sa priamo použili ako reprezentatívne skelety alebo farmakologicky aktívne „fingerprinty“ na následnú selekciu a syntézu zlúčenín.
Tretí krok zahŕňal použitie vyššie opísaných reprezentatívnych kostier ako templátov na virtuálny skríning a selekciu zlúčenín. Týmto spôsobom sa uskutočňovalo štrukturálne prehľadávanie databázy s viac ako 250000 komerčne dostupnými zlúčeninami, použitím tak vypočítaných fingerpritnov, ako aj ich fragmentov a kombinácií. Celkovo sa na základe prieskumu získalo 2846 zlúčenín a na kontrolné účely sa použila rovnaká zbierka 1280 náhodne vybraných zlúčenín, ktorá bola opísaná v príklade 1.
Štvrtý a piaty krok, predstavujúce finálne fázy procesu, sa uskutočňovali paralelne. Štvrtý krok zahŕňal testovanie získaných zlúčenín v enzýmovom teste. Z 2846 molekúl vybraných na základ reprezentatívnych kostier, vykazovalo inhibičnú aktivitu 88 molekúl, keď sa testovali v koncentrácii 5 μΜ. Spomedzi nich šesť vykazovalo IC50 v rozsahu 0,2 až 2 μΜ a jedna zlúčenina, označená ako zlúčenina B, vykazovala IC5o 164 nM (obrázok 13).
Obrázok 13 ilustruje účinok zlúčeniny B na kinázovo závislú proteínovú fosforyláciu. Daná kináza sa inkubovala s rádioaktívne značeným ATP a peptidovým substrátom v prítomnosti zvyšujúcich sa koncentrácií zlúčeniny B. Proteínová fosforylácia sa merala použitím štandardných rádiometrických techník.
-39Zlúčenina B významne inhibovala kinázovo závislú fosforyláciu proteínového substrátu, pričom vykazovala IC50164 nM.
Spomedzi 1280 náhodne vybraných zlúčenín testovaných na kontrolné účely, len tri vykazovali inhibičnú aktivitu v skríningovom teste, pričom najúčinnejšia z nich vykazovala IC50 len 7,8 μΜ. Takže súbor zlúčenín kompilovaný na základe reprezentatívnych fingerprintov bol 13,2 krát efektívnejší pri poskytovaní aktívnych molekúl ako súbor náhodne vybraných zlúčenín (p < 0,001). Okrem toho sa zistilo, že zlúčenina B predstavuje novú, doteraz nepublikovanú, triedu ATPkompetitívnych kinázových inhibitorov, ktorá má viac ako 250-násobnú selektivitu voči danej kináze, ked sa testuje v selektívnych testoch použitím tak štrukturálne príbuzných, ako aj funkčne príbuzných alternatívnych kináz.
Piaty krok spočíval v použití jednej alebo viacerých vyššie opísaných reprezentatívnych kostier na priamy koncepčný dizajn a syntézu nových chemických zlúčenín v zmysle riešenej úlohy a z pohľadu identifikácie nových molekúl s kinázovými inhibičnými aktivitami. Týmto spôsobom sa zostavil zoznam chemických reaktantov a reakčných produktov, ktoré obsahujú vyššie opísané biologicky aktívne reprezentatívne skelety alebo ich fragmenty bud v chemických štruktúrach reaktantov, alebo vo výsledných reakčných produktoch. Vybralo sa viac ako 4000 kombinácií reaktantov a syntetizovali sa zodpovedajúce reakčné produkty na testovanie. Testovanie týchto zlúčenín v skríningovom teste viedlo k identifikácii dvoch nových tried chemických zlúčenín, v zmysle riešenej úlohy, z ktorých množstvo reprezentantov vykazovalo IC50 v rozsahu 100 až 500 nM.
Príklad 3
Racionálna identifikácia nových a selektívnych blokátorov iónových kanálov
Vyvinul sa test pre iónový kanál považovaný za kanál hrajúci úlohu v neurodegenerácii, pre ktorý ešte predtým neboli v literatúre opísané žiadne inhibítory. Zostavila sa zbierka zlúčenín na testovanie v teste a v súlade so spôsobom podľa predloženého vynálezu sa identifikovali nové inhibítory. Prvý krok spočíval v generovaní nevyhnutných štrukturálnych dát a identifikáciu chemických determinantov inhibitorov daného kanála. Toto sa uskutočňovalo testovaním prvých
-403680 zlúčenín našej spojenej zbierky v koncentrácii 5 μΜ v skríningovom teste a anotáciou každej štruktúry v zozname podľa jej inhibičnej aktivity. Použitím hranice 40% inhibície, ako prahovej hodnoty pre klasifikáciu, sa identifikovalo 36 štruktúr ako aktívnych, pričom ostávajúcich 3644 zlúčenín sa kvalifikovalo ako neaktívne.
Druhý krok spočíval v identifikácii biologicky aktívnych chemických determinantov obsiahnutých v štruktúrach 36 inhibítorov. Týmto spôsobom sa analyzovalo 3680 anotovaných štruktúr vybraním predtým opísanej miery asociácie (I), kde x znamená počet aktívnych chemických štruktúr obsahujúcich daný chemický determinant, y znamená celkových počet chemických štruktúr obsahujúcich rovnaký chemický determinant, z znamená celkový počet aktívnych chemických štruktúr v súbore N molekúl (tzn. z = 36) a N znamená celkový počet chemických štruktúr podrobených analýze (tzn. N = 3680). Miera asociácie (I) sa potom vyvinula na funkciu na výpočet skóre (V), pričom pre priemerného odborníka v oblasti bude zrejmé, že táto funkcia je produktovým momentovým korelačným koeficientom odrážajúcim stupeň zdieľanej variancie medzi dvoma dichotómnymi premennými, ktoré nie sú explicitne uvedené vo vzorci (V).
(V)
Skóre =
Nx-yz
Vz(N-z)y(N-y)
V tomto prípade sa nepoužili žiadne ďalšie premenné okrem x, y, z alebo N vo funkcii na výpočet skóre, hoci pre priemerného odborníka v oblasti bolo jasné, že funkcia na výpočet skóre (V) sa môže modifikovať tak, aby zahŕňala ďalšie premenné týkajúce sa molekulového materiálu, biologických, chemických a/alebo fyzikálno-chemických vlastností, ako je uvedené, ale bez obmedzenia na vlastnosti uvedené v príklade 1. Pre priemerného odborníka v oblasti bude tiež zrejmé, že iné miery asociácie a/alebo funkcie na výpočet skóre sa môžu použiť na rovnaký účel namiesto tých, ktoré sú opísané vo vzorcoch (I) a (V), najmä funkcia na výpočet skóre (V) nie je nemenná čo sa týka rôznych zmien v návrhu štúdie a/alebo distribúcií y, (N-y), z a (N-z). Najrelevantnejšie z týchto alternatívnych metód,
-41 v zmysle predloženého vynálezu, obsahujú rôzne kombinácie dvoch, troch alebo štyroch z premenných x, y, z a N.
Nasledujúce panely znázorňujú príklady chemických determinantov použitých na analýzu a selektovaných na ďalší postup. Celkovo sa testovalo 3680 štruktúr anotovaných z hľadiska kanálovej inhibičnej aktivity na prítomnosť biologicky aktívnych subštruktúr použitím súboru chemických determinantov zahŕňajúceho päť determinantov ilustrovaných na paneli A. Spomedzi piatich štruktúr determinat č. 4 vykazoval najvyššiu hodnotu skóre, ktorá indikovala, že má najvyššiu pravdepodobnosť byť základom kanálovej inhibičnej aktivity. V súlade s tým sa výpočty opätovne opakovali pre štruktúry obsahujúce determinant č. 4 a chemická štruktúra uvedená na paneli B sa identifikovala ako jeden z najväčších, štatisticky významných, determinantov nachádzajúcich sa v podsúbore 36 inhibítorov, a následne sa vybrala na ďalší postup. Symboly: A znamená C, N, O alebo S, B znamená H alebo OH.
č. 4 č. 5
Skóre = 0,21 Skóre = 0,03
Analýza 3680 anotovaných štruktúr sa uskutočňovala prostredníctvom vypočítavania skóre sérií chemických determinantov so vzorcom (V), pričom sa zachovávali najvyššie výťažky, beznulové pozitíve hodnoty. Príklady niektorých z chemických determinantov použitých v tomto procese sú uvedené na paneli A spolu s ich vypočítanými hodnotami skóre. Spomedzi týchto, determinant č. 4 vykazoval najvyššie skóre a odhadlo sa, že pravdepodobnosť, že sa nachádza v podsúbore kanálových blokovacích štruktúr náhodou je menšia ako 1 ku 100 (p < 0,01). V súlade s tým bol determinant č. 4 akceptovaný ako reprezentant biologicky aktívnej skupiny veľkej časti 36 inhibítorov a výpočty použitím vzorca (V) sa potom
-42opätovne opakovali, aby sa určilo, či by bolo možné identifikovať väčšie chemické determinanty. Najväčší, štatisticky významný, chemický determinant nájdených týmito ďalšími výpočtami je uvedený na paneli B. Štruktúra sa vybrala ako reprezentatívna chrbtica alebo farmakologicky aktívny „fingerprit“ na následnú selekciu a syntézu zlúčenín.
Tretí krok spočíval v použití reprezentatívneho skeletu znázorneného na paneli B ako templátu na virtuálny skríning a selekciu zlúčenín. Týmto spôsobom sa uskutočňoval subštrukturálny prieskum v databáze obsahujúcej viac ako 400000 komerčne dostupných zlúčenín, pričom sa na tento účel použil tak vypočítaný fingerprint, ako aj jeho fragmenty. Na základe týchto prieskumov sa získalo celkovo 1760 zlúčenín a rovnaká zbierka obsahujúca 1280 náhodne vybraných zlúčenín, opísaná v príklade 1, sa použila na kontrolné účely.
Štvrtý a piaty krok, predstavujúce finálne fázy procesu, sa uskutočňovali paralelne. Štvrtý krok spočíval v testovaní získaných zlúčenín v enzýmovom teste. Z 1760 molekúl vybraných na základe reprezentatívnych kostier, 84 molekúl vykazovalo aspoň 40% inhibičnú aktivitu, keď sa testovali v teste v koncentrácii 5 μΜ. Spomedzi nich 8 molekúl vykazovalo IC50 v submikromolárnom rozsahu a jedna zlúčenina, označená ako zlúčenina C, vykazovala IC50 400nM. Nižšie sú uvedené dva príklady z týchto kanály inhibujúcich zlúčenín, pričom obe zlúčeniny obsahujú presný farmakologicky aktívny „fingerprint“ znázornený na paneli B:
Cl
Cl
Tieto dve kanál inhibujúce zlúčeniny boli vybraná na testovanie použitia spôsobu podľa predloženého vynálezu. Obe molekuly významne inhibujú daný kanál. Ako je ukázané prostredníctvom zvýraznenia subštruktúr, chemické štruktúry týchto dvoch zlúčenín obsahujú farmakologicky aktívny chemický determinant
-43identifikovaný použitím spôsobu podľa predloženého vynálezu a znázornený vyššie na paneli B.
Spomedzi 1280 náhodne vybraných zlúčenín testovaných na kontrolné účely vykazovalo celkovo 33 molekúl aspoň 40% inhibičnú aktivitu v skríningovom teste. Takže súbor zlúčenín kompilovaný na základe reprezentatívneho fingerprintu znázorneného na paneli B bol 1,8-krát efektívnejší pri poskytovaní aktívnych molekúl ako súbor náhodne vybraných zlúčenín (p < 0,005). Súbor zlúčenín kompilovaný na základe reprezentatívneho fingerprintu znázorneného na paneli B bol aj 4,9 násobne účinnejší pri poskytovaní aktívnych zlúčenín v porovnaní so súborom prvých 3680 zlúčenín spojenej zbierky zlúčenín (p < 0,0001).
Piaty krok spočíval v použití reprezentatívneho skeletu, znázorneného na paneli B, na priamy koncepčný dizajn a syntézu nových chemických zlúčenín, v zmysle riešenej úlohy a vo vzťahu k identifikácii nových molekúl s kanálovými inhibičnými vlastnosťami. Týmto spôsobom sa na ďalší postup vybral jeden zo 120 vyššie opísaných farmakologicky aktívnych inhibítorov a chemicky sa modifikoval použitím predtým zostavených pozitívnych a negatívnych skríningových výsledkov ako zdroja informácie o vzťahu štruktúry a aktivity. Táto práca viedla k syntéze a následnej identifikácii novej, doteraz neopísanej triedy kanálových blokátorov, v zmysle riešenej úlohy, z ktorých množstvo vykazovalo IC5o v rozsahu 100 až 500 nM. Zo selektívneho testovania vyplynulo, že zlúčenia je selektívna pre požadovaný kanál oproti 30 iným liekovým cieľom a inhibuje bunkovú smrť v modeli apoptózy indukovanej odstránením nervového rastového faktora.
Príklad 4
Racionálna identifikácia nových a selektívnych proteázových inhibítorov
Vyvinul sa enzýmový test pre proteázu považovanú za hrajúcu kľúčovú úlohu pri ischemickom poškodení a poranení. Testovaná proteáza bola členom rodiny blízko príbuzných enzýmov, ktoré sami sú cieľmi terapeutickej intervencie. Zostavila sa zbierka zlúčenín na testovanie v teste, testovala sa a spôsobom podľa predloženého vynálezu sa identifikovali nové enzýmové inhibítory. Prvý krok spočíval v generovaní nevyhnutných štrukturálnych údajov na identifikáciu
-44chemických determinantov inhibítorov enzýmu. Toto sa uskutočnilo testovaním zbierky 1680 zlúčenín v koncentrácii 3 μΜ v skríningovom teste a anotovaním každej štruktúry z hľadiska inhibičnej aktivity. Použitím hranice 40% inhibície ako prahovej hodnoty na klasifikáciu zlúčeniny, 17 štruktúr sa identifikovalo ako aktívnych a zvyšných 1663 molekúl sa kvalifikovalo ako inaktívnych.
Druhý krok spočíval v identifikáciu biologicky aktívnych determinantov obsiahnutých v štruktúrach 17 inhibítorov. Týmto spôsobom sa analyzovalo 1680 anotovaných štruktúr prostredníctvom selekcie zmiešanej miery asociácie uvedenej nižšie (VI), kde x znamená počet aktívnych chemických štruktúr obsahujúcich daný chemický determinant, y znamená celkových počet chemických štruktúr obsahujúcich rovnaký chemický determinant, z znamená celkový počet aktívnych chemických štruktúr v súbore N molekúl (tzn. z = 17) a N znamená celkový počet chemických štruktúr podrobených analýze (tzn. N = 1680). V tomto prípade sa miera asociácie (Vl) priamo použila ako funkcia na výpočet skóre na identifikáciu biologicky aktívnych chemických determinantov obsiahnutých v 17 významných inhibítoroch.
V tomto kontexte neboli použité žiadne iné premenné okrem x, y, z alebo N vo funkcii na výpočet skóre, hoci pre priemerného odborníka v oblasti je zrejmé, že vzorec (VI) by sa mohol modifikovať tak, aby obsahoval ďalšie premenné súvisiace s molekulovým materiálom, biologickými, chemickými a/alebo fyzikálno-chemickými vlastnosťami uvedenými v príklade 1, ale bez obmedzenia na ne.
Pre priemerného odborníka v oblasti bude tiež zrejmé, že aj iné miery asociácie a/alebo funkcie na výpočet skóre sa môžu použiť na rovnaký účel namiesto tých, ktoré sú opísané vo vzorci (VI), najmä preto, že priame použitie tejto miery asociácie umožňuje len relatívny odhad pravdepodobnosti toho, že daný chemický determinant je základom biologickej aktivity. Najrelevantnejšie z týchto alternatívnych metód, v zmysle predloženého vynálezu, obsahujú rôzne kombinácie dvoch, troch alebo štyroch z premenných x, y, z a N.
-45Analýza 1680 anotovaných štruktúr sa uskutočňovala určovaním skóre sérií chemických determinantov so vzorcom (VI) a zachovávaním štruktúr s najvyššími pozitívnymi hodnotami. Príklady niektorých z týchto determinantov použitých v tomto procese sú znázornené nižšie na paneli A, spolu s ich vypočítanými hodnotami skóre. Spomedzi nich, determinanty č. 7 a 8 vykazovali najvyššie skóre a akceptovali sa ako reprezentanti jednej alebo viacerých biologicky aktívnych skupín obsiahnutých v podstatnom podiele 17 inhibítorov. Výpočty použitím vzorca (VI) sa potom opätovne opakovali, aby sa určilo, či by sa nemohol identifikovať väčší chemický determinant, čo sa v tomto prípade, kedy sa použila dostupná zbierka 17 štruktúr, nepodarilo. Determinanty č. 7 a 8 sa spojili, aby sa vytvorila reprezentatívna chrbtica alebo farmakologicky aktívny „fingerprint“ znázornený nižšie na paneli B, ktorý sa následne použil na selekciu a syntézu zlúčenín.
| 0 |l | O A | O A | O A |
| il 0 | O | O | I) 0 |
| č. 6 | č. 7 | č. 8 | č. 9 |
| Skóre = 0,25 | Skóre = 0,32 | Skóre = 0,27 | Skóre = 0,17 |
jednoduchá alebo dvojitá väzba
Na týchto paneloch sú znázornené príklady chemických determinantov použitých na analýzu a vybraných na ďalší postup. Celkovo sa 1680 štruktúr s priradenou proteázovou inhibičnou aktivitou testovalo na prítomnosť biologicky aktívnych subštruktúr použitím súboru chemických deteminantov obsahujúcich štyri determinanty ilustrované na paneli A. Spomedzi týchto štyroch štruktúr determinanty č. 7 a 8 vykazovali najvyššie hodnoty skóre, z čoho vyplývalo, že majú najvyššiu pravdepodobnosť byť základom inhibičnej aktivity. Na porovnanie, determinant pozostávajúci s jednoduchého benzénového kruhu mal skóre 0,02. Keďže sa pri opätovne opakovaných výpočtoch s determinantmi č. 7 a 8 neidentifikovali žiadne štruktúry s vyšším skóre, tieto dve štruktúry sa spojili do chemického motívu znázorneného na paneli B, ktorý sa následne použil ako farmakologicky aktívny „fingerprint“ na virtuálny skríning a selekciu zlúčenín.
-46Symboly: A znamená C alebo S, B znamená H, C, N, O alebo akýkoľvek halogénový atóm.
Tretí krok spočíval v použití reprezentatívneho skeletu, znázorneného na paneli B, ako templátu na virtuálny skríning a selekciu zlúčenín. Týmto spôsobom sa uskutočňoval subštrukturálny prieskum databázy s viac ako 150000 komerčne dostupnými zlúčeninami, použitím tak vypočítaného fingerprintu, ako aj jeho fragmentov, na tento účel. Celkovo sa na základe tohto prieskumu získalo 589 zlúčenín.
Štvrtý a piaty krok procesu spočíval v testovaní získaných zlúčenín v enzýmovom teste. Z 589 zlúčenín vybraných na základe reprezentatívneho skeletu, vykazovalo 52 molekúl aspoň 40% inhibičnú aktivitu, keď sa testovali v teste s koncentráciou 3 μΜ. Spomedzi týchto, 12 zlúčenín vykazovalo IC50 v submikromoiárnom rozsahu a jedna zlúčenina, označená ako zlúčenina D, vykazovala IC50 65 nM. Šesť príkladov týchto proteázu inhibujúcich molekúl je znázornených nižšie, pričom všetky zahŕňajú aspoň raz sa vyskytujúci farmakologicky aktívny „fingerprint“ znázornený na paneli B.
-47Týchto šesť proteázu inhibujúcich zlúčenín sa vybralo na testovanie použitím spôsobu podľa predloženého vynálezu. Každá molekula signifikantne inhibovala daný proteín vykazujúc IC50 v rozsahu 0,15 až 15 μΜ. Ako je znázornené prostredníctvom zvýraznenia subštruktúr, štruktúry každej zo šiestich zlúčenín obsahovali farmakologicky aktívny chemický determinant identifikovaný použitím vynálezu, a znázornený vyššie na paneli B. Niektoré z týchto zlúčenín v skutočnosti obsahujú viac ako jeden variant fingerprintu, ako napríklad tetracyklická štruktúra znázornená vyššie v spodnom ľavom rohu.
Takže súbor zlúčenín kompilovaný na základe reprezentatívneho fingerprintu znázorneného na paneli B bol 8,7 násobne účinnejší pri poskytovaní aktívnych molekúl ako pôvodne testovaná zbierka 1680 zlúčenín (p < 0,0001). Navyše sa zistilo, že 52 racionálne identifikovaných zlúčenín je selektívnych voči danej proteáze, keďže väčšina (> 90 %) nevykazovala inhibičnú aktivitu, keď sa testovala v koncentrácii 5 μΜ na príbuznej proteáze patriacej do rovnakej enzýmovej rodiny, ako aj keď sa testovala v rovnakých podmienkach na 12 iných druhoch liekových cieľov.
Príklad 5
Racionálna identifikácia nových a selektívnych fosfatázových inhibítorov
Vyvinul sa enzymatický test pre fosfatázu považovanú za hrajúcu dôležitú úlohu v receptorovej senzibilizácii a regulácii. Zostavila sa zbierka zlúčenín na testovanie, testovala sa a spôsobom podľa predloženého vynálezu sa identifikovali nové enzýmové inhibítory. Prvý krok spočíval v generovaní nevyhnutných štrukturálnych údajov na identifikáciu chemických determinantov inhibítorov enzýmu. Toto sa uskutočňovalo testovaním prvých 12160 zlúčenín spojenej zbierky v koncentrácii 3 μΜ v skríningovom teste a anotáciou každej chemickej štruktúry ich inhibičnou aktivitou. Použitím hranice 50% inhibície ako prahovej hodnoty pre klasifikáciu zlúčenín sa ako aktívnych identifikovalo celkovo 15 chemických štruktúr a zvyšných 12145 molekúl sa kvalifikovalo ako inaktívnych.
Druhý krok spočíval v identifikácii biologicky aktívnych chemických determinantov obsiahnutých v štruktúrach 15 inhibítorov. Týmto spôsobom sa
-48analyzovalo 12160 anotovaných štruktúr prostredníctvom výberu zmiešanej miery asociácie (VII), kde x znamená počet aktívnych chemických štruktúr obsahujúcich daný chemický determinant, y znamená celkových počet chemických štruktúr obsahujúcich rovnaký chemický determinant, z znamená celkový počet aktívnych chemických štruktúr v súbore N molekúl (tzn. z = 15) a N znamená celkový počet chemických štruktúr podrobených analýze (tzn. N = 12145).
(VII) (X/z) - (z-x)/(N-z)
Miera asociácie (VII) sa potom vyvinula na funkciu skóre (VIII), pričom pre priemerného odborníka v oblasti je zrejmé, že sa týka odhadu relatívneho rizika použitím sklonu regresnej línie predstavujúceho stupeň zdieľanej variancie, ktorá existuje medzi dvoma dichotómnymi premennými, a bola ďalej modifikovaná na počítanie s molekulovou hmotnosťou každého zvažovaného chemického determinantu (MW).
(VIII) Skóre =MW-el(x'z)-(z-x)/(N-z)l
V tomto kontexte sa nepoužili žiadne ďalšie premenné okrem x, y, z, N alebo MW vo funkcii na výpočet skóre, hoci pre priemerného odborníka v oblasti bolo jasné, že vzorec (VIII) by sa mohol modifikovať tak, aby zahŕňal ďalšie premenné týkajúce sa molekulového materiálu, biologických, chemických a/alebo fyzikálnochemických vlastností uvedených, ale bez obmedzenia, vpríklade 1. Pre priemerného odborníka v oblasti bude tiež zrejmé, že iné miery asociácie a/alebo funkcie na výpočet skóre sa môžu použiť na rovnaký účel namiesto tých, ktoré sú opísané vo vzorci (VIII), najmä preto, že porovnanie sklonov v niektorých prípadoch nemusí umožniť dostatočnú diskrimináciu medzi blízko príbuznými chemickými determinantami. Najrelevantnejšie z týchto funkcií na výpočet skóre, v zmysle predloženého vynálezu, obsahujú rôzne kombinácie dvoch, troch alebo štyroch z premenných x, y, z a N.
Analýza 12160 anotovaných štruktúr sa uskutočňovala výpočtom skóre pre série chemických determinantov so vzorcom (VIII) a zachovávaním štruktúr
-49s najvyššími pozitívnymi hodnotami. Toto viedlo k identifikácii troch rozdielnych chemických determinantov s molekulovou hmotnosťou v rozsahu od 120 do 220 Da, pre ktoré bola pravdepodobnosť, že sa v danom podsúbore aktívnych chemických štruktúr vyskytujú náhodou, menšia ako 1:10 (p < 0,1). V súlade stým sa tri chemické determinanty akceptovali ako reprezentanti jednej alebo viacerých biologicky aktívnych skupín 15 enzýmových inhibítorov identifikovaných v skríningu a zostavili sa do štvrtého zoznamu. Výpočty použitím vzorca (VIII) sa potom opätovne opakovali, aby sa zistilo, či by nemohol byť identifikovaný väčší chemický determinant ako výsledok kombinácie, alebo ďalšej expanzie ktoréhokoľvek z týchto troch fragmentov. Najväčší, štatisticky signifikatný chemický determinant, ktorý sa našiel prostredníctvom týchto ďalších výpočtov, mal molekulovú hmotnosť 255 Da a bol vybraný ako reprezentatívny skelet alebo farmakologicky aktívny „fingerprint“ na následnú selekciu zlúčenín.
Tretí krok zahŕňal použitie vyššie opísaného reprezentatívneho skeletu ako templátu na virtuálny skríning a selekciu zlúčenín. Týmto spôsobom sa uskutočňovali subštrukturálne prieskumy v databáze s viac ako 800000 komerčnými a vlastnými zlúčeninami použitím tak vypočítaného fingerprintu, ako aj jeho fragmentov, na tento účel. Celkovo sa vybralo 1242 zlúčenín na testovanie na základe týchto prieskumov, a rovnaká zbierka 1280 náhodne vybraných zlúčenín, opísaná v príklade 1, sa použila na kontrolné účely.
Štvrtý a konečný krok procesu zahŕňali testovanie zlúčenín v enzýmovom teste. Z 1242 zlúčenín, vybraných na základe reprezentatívnych kostier, 34 molekúl vykazovalo aspoň 50% inhibičnú aktivitu, keď sa testovali v koncentrácii 3 μΜ. Spomedzi nich, osem zlúčenín vykazovalo IC50 v submikromolárnom rozsahu a jedna zlúčenina, označená ako zlúčenina E, vykazovala IC50 87 nM (obrázok 14).
Obrázok 14 ilustruje účinok zlúčeniny E na proteínovú defosforyláciu závislú na fosfatáze. Daná fosfatáza sa inkubovala s fosforylovaným peptidovým substrátom v prítomnosti zvyšujúcich sa koncentrácií zlúčeniny E. Defosforylácia substrátu sa testovala prostredníctvom merania uvoľňovania voľného fosfátu do reakčného média s malachitovou zeleňou. Zlúčenina E významne inhibovala defosforyláciu závislú na fosfatáze, pričom vykazovala IC50 87 nM.
-50Spomedzi 1280 náhodne vybraných zlúčenín testovaných na kontrolné účely, len dve vykazovali inhibičnú aktivitu v skríningovom teste, pričom najúčinnejšia z nich vykazovala IC50 len 1,8 μΜ. Takže súbor zlúčenín kompilovaný na základe reprezentatívnych fingerprintov bol 17,5-násobne účinnejší pri poskytovaní aktívnych molekúl, ako súbor náhodne vybraných zlúčenín (p < 0,0005) a 22,3-krát účinnejší ako prvých 12160 zlúčenín spojenej zbierky zlúčenín (p < 0,00001)
Nakoniec, zistilo sa, že zlúčenina E predstavuje novú, doteraz nepublikovanú, triedu fosfatázového inhibítora, vykazujúcu viac ako 20-násobnú selektivitu voči danému cieľu, keď sa testuje v testoch selektivity použitím tak štrukturálne, ako aj funkčne príbuzných alternatívnych fosfatáz.
Príklad 6
Zvyšovanie potenciálu chemických sérií
Vynález sa môže použiť aj na zvyšovanie potenciálu chemických sérií. Ako príklad sa testovala zbierka 1251 zlúčenín v koncentrácii 3 μΜ v proteázovom teste, pričom výsledkom bolo 25 zlúčenín vykazujúcich aspoň 40% inhibičnú aktivitu. Analýza štruktúr sa uskutočňovala ako je opísané v príklade 1, a viedla k identifikácii množstva chemických determinantov, z ktorých pre jeden bola pravdepodobnosť, že sa náhodne vyskytuje medzi 7 z 25 proteázových inhibítorov, menšia ako 1:10000 (p < 0,0001). Nanešťastie, sedem zlúčenín obsahujúcich tento determinant vykazovalo len mierne inhibičné aktivity (priemerná IC5o = 3,4 μΜ ± 1,34 μΜ, n =7), čo ich robilo neatraktívnymi na ďalší chemický postup. Preto sa otázny determinant akceptoval ako reprezentant biologicky aktívnej skupiny daných inhibítorov a priamo sa použil ako reprezentatívny skelet alebo farmakologicky aktívny „fingerprint“ na ďalšiu selekciu zlúčenín.
Týmto spôsobom sa skrínovala databáza s viac ako 100000 komerčne dostupnými molekulami z hľadiska daného determinantu a na ďalšie testovanie sa vybralo 142 molekúl. Spomedzi týchto 142 zlúčenín 11 vykazovalo inhibičné aktivity v submikromolárnom rozsahu vykazujúc priemernú IC50 0,48 μΜ ± 0,09 μΜ (n = 11, čiže priemerná IC50 bola významne nižšia ako predchádzajúca hodnota p < 0,05).
-51 Takže spôsob podľa predloženého vynálezu umožňuje významné zvýšenie farmakologického potenciálu chemických sérií.
Príklad 7
Zvyšovanie selektivity chemických sérií
Vynález sa môže použiť aj na zvyšovanie selektivity chemických sérií. Ako príklad sa testovala zbierka 3360 zlúčenín v koncentrácii 3 μΜ v kinázovom teste, označenom ako kinázový test č. 1, čoho výsledkom bolo 22 zlúčenín vykazujúcich aspoň 40% inhibičné aktivity. Analýza štruktúr sa uskutočňovala ako je opísané v príklade 2, čo viedlo k identifikácie množstva chemických determinantov, z ktorých jeden, označený ako „determinant č. 10“, sa odhadol ako determinant, ktorého pravdepodobnosť náhodného výskytu medzi 3 z 22 kinázových inhibítorov je menšia ako 1 ku 20 (p < 0,05). Nanešťastie, testy selektivity uskutočňované so štyrmi inými kinázami odhalili, že determinant č. 10 je aj dôležitou súčasťou inhibítorov inej kinázy, označenej ako kináza č. 2, z čoho vyplynulo, že efektívne inhibítory kinázy č. 1 sa nemôžu vyvinúť len na základe determinantu č. 10. V skutočnosti, tri štruktúry obsahujúce determinant č. 10 boli rovnako účinné pre dve kinázy, vykazujúc priemerné IC50 7,2 μΜ ± 3,81 μ M (n= 3) pre kinázu č. 1 a priemerné IC50 21,5 μΜ ± 9,29 μΜ (n = 3) pre kinázu č. 2, čo reprezentuje selektívny pomer v prospech kinázy č. 1 dosahujúci len 2,98.
Z tohto dôvodu sa 3360 zlúčenín testovaných na kináze č. 1 znova testovalo v koncentrácii 3 μΜ na kináze č. 2, čoho výsledkom bolo 92 zlúčenín vykazujúcich aspoň 40% inhibičnú aktivitu. Zoznam 3360 zlúčenín sa následne anotoval tak aktivitou kinázy č. 1, ako aj aktivitou kinázy č. 2, a analýza sa uskutočňovala spôsobom podľa predloženého vynálezu, pričom sa vybrala miera asociácie (III) a vyvinula sa na funkciu skóre (IX), kde Xi znamená počet chemických štruktúr aktívnych na kináze č. 1 obsahujúcich daný chemický determinant, x2 znamená počet chemických štruktúr aktívnych na kináze č. 2 a obsahujúcich rovnaký chemický determinant, y znamená celkový počet chemických štruktúr obsahujúcich chemický determinant, Z\ znamená celkový počet chemických štruktúr aktívnych na kináze č. 1 v súbore N molekúl (tzn. zi = 22), z2 znamená celkový počet chemických
-52štruktúr aktívnych na kináze č. 2 v súbore N molekúl (tzn. z2 = 92) a N znamená celkový počet chemických štruktúr podrobených analýze (tzn. N = 3360).
(IX)
Skóre = x1 (N - y - z1 + x1 )(z2 - x2 )(y - x2) x2(N - y - z2 + x2 - x, )(y - x,)
Priemernému odborníkovi v oblasti bude zrejmé, že funkcia na výpočet skóre (IX) je spôsobom na porovnanie relatívnych rizík, umožňujúcim identifikáciu chemických determinantov, ktoré sú s najvyššou pravdepodobnosťou selektívne pre jednu kinázu a neselektívne pre druhú. V tomto kontexte je pre priemerného odborníka v oblasti zrejmé, že vzorec (IX) by mohol byť modifikovaný tak, aby zahŕňal ďalšie premenné súvisiace s molekulovým materiálom, biologickými, chemickými a/alebo fyzikálno-chemickými vlastnosťami uvedenými, ale bez obmedzenia, v príklade 1. Nakoniec je tiež zrejmé, že aj iné miery asociácie a/alebo funkcie na výpočet skóre sa môžu použiť na rovnaký účel namiesto tých, ktoré sú opísané vo vzorcoch (III) a (IX). Napríklad miera asociácie (I) by mohla byť použitá vo funkcii na výpočet skóre (II) a výsledné hodnoty skóre pre kinázovú aktivitu č. 2 by sa mohli odčítať od hodnôt získaných pre kinázovú aktivitu č. 1, alebo naopak, hodnoty získané pre kinázovú aktivitu č. 1 by sa mohli deliť hodnotami získanými pre kinázovú aktivitu č. 2. Možných je aj množstvo iných prístupov, z ktorých najrelevantnejšie v zmysle predloženého vynálezu využívajú funkcie na výpočet skóre zahŕňajúce rôzne kombinácie dvoch, troch zo štyroch premenných x, y, z a N.
Výpočet skóre pre série chemických determinantov so vzorcom (IX) viedol k identifikácii množstva chemických determinantov selektívnych pre kinázu č. 1, z ktorých jeden, označený ako „determinant č. 11“ pozostával z determinantu č. 10 substituovaného s ďalším chemickým motívom. Takže determinant č. 11 bol akceptovaný ako reprezentant farmakologicky aktívnej skupiny selektívnych inhibítorov kinázy č. 1 a bol použitý ako reprezentatívny skelet alebo farmakologicky aktívny „fingerprint“ na následnú selekciu zlúčenín. Týmto spôsobom sa uskutočňovali subštrukturálne prieskumy databázy s viac ako 400000 komerčne dostupnými zlúčeninami použitím determinantu č. 11 a jeho fragmentov. Na základe týchto prieskumov sa získalo celkovo 498 zlúčenín, ktoré po testovaní v dvoch
-53testoch poskytli tri inhibítory obsahujúce determinant č. 11 a vykazujúce priemernú IC50 0,94 μΜ ± 0,52 μΜ (n = 3) v kinázovom teste č. 1 a priemernú IC50 31,6 μΜ ± 4,41 μΜ (n = 3) v kinázovom teste č. 2. Tento výsledok znamená 11-násobné zvýšenie pomeru selektivity v prospech kinázy č. 1 oproti kináze č. 2 (od 2,98 do 33,6, p < 0,05) v sériách, čo demonštruje, že spôsob podľa predloženého vynálezu umožňuje zvýšenie farmakologickej selektivity daných chemických sérií.
Príklad 8
Racionálna identifikácia sérií s multiplicitnými farmakologickými účinkami
Vyvinul sa funkčný test pre iónový kanál uzatváraný ligandom považovaný za hrajúci úlohu v imunitnej odpovedi. Zostavila sa zbierka zlúčenín na testovanie v teste, testovala a spôsobom podľa predloženého vynálezu sa identifikovali nové blokátory iónového kanála. Skúmaný kanál bol opísaný ako patriaci do rodiny cieľov, ktoré sú permanentné pre sodíkové ióny, aktivované purínovými nukleotidmi a inhibované určitými blokátormi sodných kanálov. V tomto kontexte bolo rozhodnuté identifikovať farmakologické fingerprity majúce duálnu schopnosť napodobovať purínové nukleotidy a zároveň inhibovať sodné kanály, pričom išlo o zvýšenie šanci na rýchlu identifikáciu inhibítorov daného iónového kanále uzatváraného ligandom.
Prvý krok procesu zahŕňal kompiláciu dvoch zoznamov chemických štruktúr prostredníctvom spracovania súčasnej literatúry. Prvý zoznam obsahoval štruktúry 79 dokumentovaných inhibítorov sodíkového kanála. Druhý zoznam obsahoval štruktúry 2367 inhibítorov proteínov viažucich purínové nukleotidy (podrobnosti pozri v príklade 2). Druhý krok procesu spočíval v identifikácii biologicky aktívnych chemických determinantov, ktoré sa zároveň nachádzajú v oboch zoznamoch chemických štruktúr. Týmto spôsobom sa každý zoznam doplnil o štruktúry viac ako 100000 molekúl, opísaných ako nemajúcich žiadny účinok na daný náhradný cieľ (ciele), a analýza sa uskutočňovala prostredníctvom výberu subtraktívnej miery asociácie (I), ako bolo opísané v príklade 1, a vyvinula sa na funkciu na výpočet skóre (X), kde xi znamená počet chemických štruktúr aktívnych na sodíkových kanáloch a obsahujúcich daný chemický determinant, x2 znamená počet
-54chemických štruktúr aktívnych na proteínoch viažucich purínové nukleotidy a obsahujúcich rovnaký chemický determinant, yi znamená celkový počet štruktúr obsahujúcich chemický determinant v zozname štruktúr označených ako majúcich
chemický determinat v zozname štruktúr označených ako inhibujúce proteín viažuci purínové nukleotidy, zi znamená celkový počet štruktúr inhibujúcich sodíkové kanály v súbore ΝΊ molekúl (tzn. z^ = 79), z2 znamená celkový počet chemických štruktúr účinkujúcich ako proteíny viažuce purínové nukleotidy v súbore N2 molekúl (tzn. z2 = 2367) a N-ι a N2 predstavujú celkový počet chemických štruktúr podrobených analýze v príslušných zoznamoch anotovaných štruktúr.
Skóre
Pre priemerného odborníka v oblasti bude zrejmé, že funkciou na výpočet skóre (X) je spôsob kombinácie dvoch rozdielnych testov asociácie, ktorý umožňuje identifikáciu chemických determinantov, ktoré majú s najväčšou pravdepodobnosťou účinok na sodné kanály, a zároveň aj na proteíny viažuce purínové nukleotidy. V tomto kontexte je pre priemerného odborníka v oblasti zrejmé, že vzorec (X) by mohol byť modifikovaný tak, aby obsahoval ďalšie premenné týkajúce sa molekulového materiálu, biologických, chemických a/alebo fyzikálno-chemických vlastností uvedených, ale bez obmedzenia, v príklade 1. Je zrejmé, že na rovnaký účel by sa mohli použiť aj iné miery asociácie a/alebo funkcie na výpočet skóre namiesto tých, ktoré sú opísané vo vzorcoch (I) a (X), najmä preto, že funkcia na výpočet skóre (X) neberie do úvahy smer rozdielov existujúcich medzi proporciami dvoch dátových súborov, čo vyžaduje, aby tieto proporcie boli porovnateľné a navyše, aby Ni bolo porovnateľné s N2, a aby obe hodnoty boli väčšie ako 20. Napríklad, môže byť želateľné zvážiť výsledky dátových súborov, keď sú veľkosti vzoriek značne rozdielne, použitím funkcie na výpočet skóre založenej na zvažovaní priemeru rozdielu medzi proporciami (pozri príklad 21 ďalej). Alternatívne, môže byť žiaduce zahrnúť tretiu alebo štvrtú alebo ďalšiu farmakologickú vlastnosť do
-55výpočtov, a v tom prípade je zrejmé, že vzorec (X) sa môže vyvinúť na jeho všeobecnejšiu formu (XI), kde d znamená počet zoznamov zlúčenín podrobujúcich sa analýze, a kde výsledné hodnoty skóre môžu byť priamo odvádzané z tabuliek štandardnej normálnej distribúcie, aby sa determinovala pravdepodobnosť nájdenia jedného alebo viacerých chemických determinantov, ktoré sú základom všetkých farmakologických vlastností, ktoré pripadajú do úvahy. Možných je aj množstvo iných prístupov, z ktorých najrelevantnejšie, v zmysle predloženého vynálezu, využívajú funkcie na výpočet skóre zahŕňajúce rôzne kombinácie dvoch, troch alebo štyroch z premenných x, y, z a N.
(XI)
Skóre
A J (Nx-yz)2N Vď V z(N - z)y(N - y)
Analýza dvoch zoznamov anotovaných štruktúr sa uskutočňovala prostredníctvom vypočítania skóre pre série chemických determinantov so vzorcom (X) a zachovaním štruktúr s najväčšími hodnotami väčšími ako 2. Toto viedlo k identifikácii chemického determinantu, ktorého pravdepodobnosť, že sa vyskytuje v oboch podsúboroch biologicky aktívnych štruktúr náhodne, bola menšia ako 1 ku 20 (p< 0,05). V súlade stým bol determinat, označený ako „determinant č. 12“, akceptovaný ako reprezentant jednej alebo viacerých biologicky aktívnych skupín tak sodíkového kanála, ako aj inhibítorov proteínov viažucich purínové nukleotidy, a bol priamo použitý ako reprezentatívny skelet alebo farmakologicky aktívny „fingerprint“ na následnú selekciu zlúčenín.
Tretí krok procesu zahŕňal použitie reprezentatívneho skeletu ako templátu na virtuálny skríning. Týmto spôsobom sa uskutočňovali subštrukturálne prieskumy v databáze s viac ako 250000 tisícami komerčne dostupných zlúčenín použitím determinantu č. 12 a jeho fragmentov na tento účel. Na základe týchto prieskumov sa získalo celkovo 800 zlúčenín, a rovnaká zbierka 1280 náhodne vybraných zlúčenín, ako bola opísaná v príklade 1, sa použila na kontrolné účely.
Štvrtý a finálny krok procesu zahŕňali testovanie získaných zlúčenín v iónovom kanálovom teste. Z 800 molekúl vybraných na základe determinantu č.
-5612, vykazovalo 23 zlúčenín aspoň 40% inhibičnú aktivitu, keď sa testovali v koncentrácii 3 μΜ. Spomedzi nich, tri zlúčeniny vykazovali IC50 v submikromolárnom rozsahu a jedna zlúčenina, označená ako zlúčenina F, vykazovala IC50 145 nM ± 56 nM (n = 4). Spomedzi 1280 náhodne vybraných zlúčení testovaných na kontrolné účely len jedna molekula vykazovala významnú inhibičnú aktivitu v nízkom mikromolárnom rozsahu a jej chemická štruktúra v skutočnosti obsahovala podstatnú časť determinantu č. 12. Je zaujímavé, že keď sa rovnaká zbierka 800 zlúčenín testovala na kináze, ktorá sa tiež považuje za hrajúcu úlohu v imunitnej odpovedi, osem zlúčenín vykazovalo aspoň 40% inhibičnú aktivitu, keď sa testovali v koncentrácii 5 μΜ, zlúčenina F vykazovala IC50 1,2 μΜ a iná zlúčenina, označená ako zlúčenia G, vykazovala IC50 137 nM 48 nM (n =4). Ďalej sa zistilo, že zlúčeniny F, G a množstvo blízko príbuzných molekúl tiež obsahujúcich determinant č. 12 vo svojej štruktúre, typicky vykazuje 50 až 100% inhibíciu pri koncentrácii 1 μΜ. Tieto výsledky spolu demonštrujú, že spôsob podľa predloženého vynálezu umožňuje výber a/alebo návrh zlúčenín s multiplicitnými farmakologickými vlastnosťami, ktoré môžu byť zaujímavé pre vývoj liekov na použitie na liečenie multifaktoriálnych chorobných stavov, ako napríklad, ale bez obmedzenia na zápal. Analogicky je tiež zrejmé, že je možné ho použiť na začlenenie nových farmakologických vlastností do chemických sérií, ktoré predtým nemali uvedené vlastnosti.
Príklad 9
Kompilovanie zoznamov biologicky aktívnych chemických determinantov
Vo výhodnom uskutočnení predloženého vynálezu môže byť spôsob použitý aj na kompilovanie zoznamov biologicky aktívnych chemických determinantov, ktoré zase môžu byť využité ako referenčné databázy na použitie na uskutočňovanie racionálneho liekového dizajnu, ako napríklad pri počítačom riadenom rozhodovaní, ktoré robia programy na použitie v medicinálnej chémii. Ako príklad sa robil prieskum vedeckej literatúry a zostavilo sa 25 zoznamov farmakologicky aktívnych molekúl, pričom každý zoznam obsahoval chemické štruktúry zlúčenín vykazujúce danú farmakologickú vlastnosť, ako napríklad viazanie sigma receptora, agonizmus dopamínového D2 receptora a antagonizmus estrogénového receptora. Každý
-57zoznam sa následne analyzoval v súlade s vynálezom prostredníctvom vybratia miery asociácie (III), ako je opísané v príklade 2, a vyvinutia na funkciu (IV), ktorá bola použitá na vypočítanie skóre pre rôzne chemické determinanty nachádzajúce sa v jednom alebo vo viacerých zoznamoch podliehajúcich analýze. Tieto výpočty viedli k identifikácii veľkého množstva farmakologicky aktívnych chemických determinantov, z ktorých tri sú uvedené v časti výslednej matrice v nasledujúcej tabuľke:
Determinant
Č. 14
čľl5 j
| Sigma ligand | D2 Agonista | Estrogénový antagonista |
| 1.85 | 8,12 | 0.05 |
| 2.40 | 0.00 | 0.00 |
| 0.91 | 2.93 | 28.17 |
Táto tabuľka poskytuje referenčný zoznam farmakologicky aktívnych chemických determinantov. Zostavilo sa dvadsaťpäť zoznamov štruktúr obsahujúcich molekuly opísané ako majúce jednu z dvadsiatich piatich rozličných farmakologických vlastností a analyzovali sa spôsobom podľa predloženého vynálezu použitím miery asociácie (III) a funkcie na výpočet skóre (IV). Týchto dvadsaťpäť vlastností zahŕňalo schopnosť viazať sigma receptory (sigma ligand), agonizmus dopamínového D2 receptora (D2 agonista) a antagonizmus estreogénového receptora (estrogénový antagonista). Malá časť výslednej matrice s 26 stĺpcami je znázornená v tabuľke vyššie. Hodnoty väčšie ako 1 indikujú, že pravdepodobnosť, že sa daný chemický determinant vyskytuje v súbore molekúl, zdieľajúcich rovnakú farmakologickú vlastnosť, náhodou, je menšia ako 1 ku 20,
-58z čoho vyplýva, že determinant je najpravdepodobnejšie molekulovým základom uvedenej vlastnosti. Tabuľky ako je tá uvedená vyššie predstavujú schránky biologicky aktívnych determinantov alebo „fingerprintov“, ktoré môžu byť použité ako referenčné zoznamy na uskutočňovanie informovaných rozhodnutí pri objavovaní a vývoji liekov.
Interpretácia výslednej tabuľky sa uskutočňuje nasledovne. Zlúčeniny, ktorých chemické štruktúry obsahujú determinant č. 13, majú vyššiu pravdepodobnosť, že budú vykazovať dopamínové D2 receptorové agonistické vlastnosti ako vlastnosti viazania na sigma receptor alebo estrogénové receptorové antagonistické vlastnosti, keďže 8,12 > 1,85 > 0,05. Naopak, determinant č. 13 je výhodným determinantom na konštruovanie zbierok potenciálnych dopamínových D2 receptorových agonistov, keďže 8,12 > 2,93 > 0,00. Rovnako, zlúčeniny, ktorých chemické štruktúry obsahujú determinant č. 14, majú vyššiu pravdepodobnosť byť ligandami sigma receptora ako agonistami dopamínového receptora alebo antagonistami estrogénového receptora, keďže 2,4 > 0,00 = 0,00. Znova, determinant č. 14 je výhodným determinantom na kompilovanie súborov sigma receptorových ligandov, keďže 2,40 > 1,85 > 0,91. Nakoniec, zlúčeniny, ktorých chemické štruktúry obsahujú determinant č. 15, majú najväčšiu pravdepodobnosť, že vykazujú vlastnosti inhibujúce estrogénový receptor, keďže 28,17 > 2,93 > 0,91, a alternatívne, determinant č. 15 je výhodným fingerprintom na kompiláciu zbierok potenciálnych antagonistov estrogénového receptora, keďže 28,17 > 0,05 > 0,00.
Pre priemerného odborníka v oblasti je zrejmé, že sa mohli použiť aj iné miery asociácie a/alebo funkcie na výpočet skóre na konštrukciu takýchto tabuliek namiesto tých, ktoré sú opísané vo vzorcoch (III) a (IV). Je tiež zrejmé, že funkcia na výpočet skóre by mohla obsahovať ďalšie premenné týkajúce sa štruktúrneho materiálu, biologických, chemických a/alebo fyzikálno-chemických vlastností, uvedených, ale bez obmedzenia, v príklade 1. Ďalej je zrejmé, že funkcia na výpočet skóre alebo proces vypočítavania skóre by tiež mohli byť modifikované tak, aby zahŕňali zvažovací alebo normalizačný krok, aby sa jednotlivé hodnoty skóre dali navzájom jednoduchšie porovnávať, čo je určite prípad vyššie uvedenej tabuľky, na konštrukciu ktorej sa použili tri vzorky s podobnou veľkosťou, ale nemusí to byť prípad iných dátových súborov. Nakoniec je zrejmé, že rovnaký
-59proces sa môže použiť na kompiláciu referenčných zoznamov štruktúr, pre ktoré boli určené skóre s ohľadom na dané vlastnosti výskumného procesu, ako napríklad, ale bez obmedzenia na všeobecné terapeutické použitie, toxicitu, absorbciu, distribúciu, metabolizmus a/alebo vylučovanie.
Príklad 10
Predpovedanie sekundárnych farmakologických účinkov molekuly
Ďalej je možné vynález použiť na predpovedanie sekundárnych účinkov molekúl. Na ilustráciu tohto sa identifikovala nová trieda blokátorov iónového kanála, ako je uvedené v príklade 3. Ako bolo opísané predtým pre iné inhibítory rovnakého kanála, základná chemická štruktúra nových sérií inhibitorov obsahuje chemický determinant znázornený na paneli B v príklade č. 3, konkrétne vo forme determinantu č. 5 znázorneného na paneli A príkladu č. 3. Porovnaním determinantu č. 5 s determinantami obsiahnutými vo vyššie uvedenej tabuľke sa došlo k predpokladu, že dané inhibítory majú veľmi vysokú pravdepodobnosť, že budú viazať sigma receptory, najmä preto, že chemická štruktúra determinantu č. 5 je identická s chemickou štruktúrou determinantu č. 14. Z toho vyplýva, že kanálové blokátory obsahujúce determinant č. 5 boli testované v σι a 02 receptorových väzobných testov a zistilo sa, že vykazujú submikromolárne afinity pre obe miesta. Takže tieto výsledky demonštrujú, že hodnoty skóre získané použitím spôsobu podľa predloženého vynálezu umožňujú predpovedať sekundárne účinky chemických sérií, čo je výnimočne užitočné pre vývoj sérií v medicínskej chémii.
Príklad 11
Identifikácia a predpovedanie toxických účinkov molekuly
Na základe predchádzajúcich príkladov je zrejmé, že spôsob podľa vynálezu môže byť použitý aj na identifikáciu toxikofórnych chemických determinantov obsiahnutých v pesticídoch, herbicídoch, insekticídoch a podobne, a to jednoducho analyzovaním zoznamov štruktúr, ktorým sú priradené toxikologické, namiesto farmakologických vlastností. V tomto kontexte sa vynález môže priamo aplikovať na
-60identifikáciu účinnejších, selektívnejších a/alebo širšie pôsobiacich chemických sérií na použitie napríklad v poľnohospodárskych chemických programoch na ochranu plodín.
Alternatívne sa vynález môže použiť na kompilovanie referenčných zoznamov alebo databáz toxických chemických determinantov podobným spôsobom ako je opísané v príklade 9. Takéto zoznamy sa potom môžu použiť na odhadnutie pravdepodobnosti s akou budú dané chemické série vykazovať daný toxický účinok, pričom sú použiteľné napríklad na skríning potravinárskych aditív a enviromentálnych chemických látok.
Na ilustráciu možnosti predpovedať toxické účinky vo farmaceutickom výskume sa testovalo 4480 zlúčenín na danej bunkovej fosfatáze na liečenie zápalu. Celkovo 25 zlúčenín vykazovalo aspoň 40% inhibičnú aktivitu, keď sa testovali v koncentrácii 10 μΜ v teste, pričom všetky vykazovali IC50 v nízkom mikromolárnom rozsahu. Výsledná analýza uskutočňovaná spôsobom podľa predloženého vynálezu viedla k identifikácii dvoch molekulárne rozličných chemických determinantov, ktoré sú najpravdepodobnejšie základom farmakologickej aktivity, a označili sa ako determinant č. 16 a 17. Keďže tieto dva determinanty sa nachádzali v rovnako účinných molekulách, a bolo pravdepodobné že sú schopné poskytnúť chemické série, ktoré by boli rovnako vhodné na ďalšie chemické spracovanie, rozhodlo sa, že výber medzi týmito dvoma determinantami bude založený na predpovedaných toxických vedľajších účinkoch.
Týmto spôsobom sa štruktúry determinantov č. 16 a 17 porovnávali so štruktúrami obsiahnutými v toxikologickej databáze a zistilo sa, že molekuly obsahujúce vo svojich štruktúrach determinant č. 16 majú významne vyššiu pravdepodobnosť, že budú cytotoxické, ako zlúčeniny obsahujúce len determinant č. 17. Z toho vyplynulo, že fosfatázové inhibítory nesúce determinant č. 16 boli menej zaujímavé v súvislosti s ďalším postupom, v dôsledku cytotoxicity vlastnej tomuto farmakologickému fingerprintu. Táto hypotéza sa overila experimentálne vystavením kultivovaných buniek 1μΜ koncentrácii oboch tried inhibítorov a meraním prežívania buniek použitím štandardného MTT testu, pričom sa zistilo, že všetky zlúčeniny obsahujúce determinant č. 16 indukujú bunkovú smrť do 24 hodín po aplikácii, čo nie je prípad väčšiny zlúčenín nesúcich determinant č. 17.
-61 Takže tieto výsledky jasne demonštrujú, že spôsob podľa predloženého vynálezu umožňuje identifikáciu a/alebo predpovedanie chemických sérií, ktoré s najväčšou pravdepodobnosťou vykazujú toxické vlastnosti v danej zostave. V tomto kontexte je zrejmé, že identické výpočty sa môžu uskutočňovať napríklad použitím dát o mutagénnosti (Ames testy), P450 izozýmových inhibičných dát alebo dát odvodených z akéhokoľvek iného relevantného testu toxicity.
Príklad 12
Identifikácia biologicky aktívnych skupín receptorových ligandov
Bunkový povrchový receptor sa vybral ako daný cieľ na riadenie určitých endokrinných porúch. Receptor bol opísaný ako endogénne aktivovaný nepeptidovým hormónom produkovaným štítnou žľazou. Prostredníctvom preskúmania vedeckej literatúry sa zostavil zoznam chemických štruktúr opísaných ako ligandy rovnakého receptora. Tento zoznam sa následne analyzoval spôsobom podľa predloženého vynálezu použitím miery asociácie, funkcie na výpočet skóre (IV) a zoznamu chemických determinantov obsahujúcom fragmenty dvadsiatich bežných aminokyselín (glycín, alanín, valín, leucín, izoleucín, prolín, serín, treonín, tyrozín, fenylalanín, tryptofán, lyzín, arginín, histidín, aspartát, glutamát, asparagín, glutamín, cysteín a metionín), spolu s fragmentárni štruktúry peptidovej kostry (NHCH-CO-)3. Príklady týchto determinantov sú uvedené nižšie:
č. 20 č. 21
č. 19
č. 22 č. 23 č. 24 č. 25
peptidová kostra
č. 27
O
č. 28
N
č. 29
II
O
č. 30 x
č. 31
N„ /Β\ηΧ
č. 32
č. 33
Tieto sú príkladmi aminokyselinových chemických determinantov a chemických determinantov odvodených od peptidovej kostry, použitých na analýzu. Zoznam receptorových ligandov sa kompiloval prostredníctvom prehľadu vedeckej literatúry a analyzoval sa v súlade s vynálezom použitím miery asociácie (III), funkcie na výpočet skóre (IV) a zoznamu chemických determinantov zloženého z rôznych fragmentov dvadsiatich bežných aminokyselín spolu s fragmentárni štruktúry peptidovej kostry (-NH-CH-CO-)3. Príklady niektorých z determinantov odvodených z tryptofánu sú uvedené v prvých dvoch riadkoch. Tieto determinant sú
-63buď exaktnými fragmentárni (napr. determinanty č. 18, 19, 20, 21 a 26), alebo zostavami exaktných fragmentov (napr. determinant č. 22), alebo neexaktnými fragmentárni (napr. determinanty č. 23, 24 a 25), alebo zostavami exaktných a neexaktných fragmentov (nie sú znázornené). Spodné dva riadky: príklady determinantov odvodených zo štruktúry peptidovej kostry (NH-CH-CO-)3, predstavujú exaktné (determinanty č. 29, 31, 32) a neexaktné fragmenty (determinanty č. 27, 28, 30, 33). Symboly: A znamená C alebo S; B znamená C alebo N; E znamená C, N, O alebo S.
Výpočet skóre fragmentov so vzorcom (IV) viedol k identifikácii množstva chemických determinantov s hodnotami skóre vyššími ako 1, z čoho vyplynulo, že pravdepodobnosť, že sa zodpovedajúce štruktúry nachádzajú v podsúbore farmakologicky aktívnych zlúčenín náhodou, je menšia ako 1 ku 20 (p < 0,05). Príklady takýchto determinantov sú znázornené nižšie spolu so zodpovedajúcimi hodnotami skóre:
č. 34
Skóre = 3,00
č. 35
Skóre = 1,17
č. 36
Skóre = 1,06
č. 37
Skóre = 3,78
N
O
č. 38
Skóre = 2,12
č. 39
Skóre = 1,18
č. 40
Skóre = 1,92
č. 41
Skóre = 2,83
-64Tieto sú príkladmi chemických determinantov s vysokým skóre, identifikovaných v prvom kole analýzy. Zbierka receptorových ligandov sa analyzovala v súlade s predloženým vynálezom prostredníctvom výpočtu skóre pre vyššie uvedené chemické determinanty, ako aj pre množstvo iných, s funkciou na výpočet skóre (IV). Hodnoty vyššie ako jedna indikovali, že pravdepodobnosť, že sa determinant nachádza v podsúbore receptorových ligandov len náhodou, je nižšia ako 1 ku 20. Vyššie uvedené obrázky ilustrujú niektoré z chemických determinantov s vyšším skóre, ktoré boli identifikované v tomto procese.
V súlade s tým sa tieto determinanty akceptovali ako reprezentanti jednej alebo viacerých aminokyselín obsiahnutých v primárnej sekvencii peptidového hormónu a zostavili sa do druhého zoznamu. Potom sa opätovne opakovali výpočty použitím vzorca (IV), aby sa identifikovali kombinácie týchto nových determinantov s najvyšším skóre, pričom množstvo z týchto nových determinantov malo hodnoty skóre vyššie ako 10. Štruktúra chemického determinantu s najvyšším skóre, označená ako determinant č. 42, sa následne porovnávala so štruktúrami 800 dipeptidov obsahujúcich rôzne kombinácie 20 aminokyselín a determinovalo sa, že len jedna dipeptidová sekvencia, označená A-i-A2, obsahuje celý determinant č. 42. Tento výsledok sa zobral ako indikujúci to, že daný hormón najpravdepodobnejšie obsahuje A-i-A2 sekvenciu niekde vo svojej primárnej štruktúre, a okrem toho to, že aspoň jedna z týchto dvoch aminokyselín hrá dôležitú úlohu pri viazaní endogénneho ligandu na jeho receptor. Overenie sekvencie hormónu odhalilo, že skutočne obsahuje predpovedanú Ai-A2 sekvenciu, čo je jav, pre ktorý bola vypočítaná pravdepodobnosť len náhodného výskytu s hodnotou len 0,019. Je zaujímavé, že iné práce dokázali, že peptidy, obsahujúce mutáciu v A2 polohe ArA2 sekvencie (napr. A1-A3 alebo ArAj namiesto A-i-A2, kde A1, A2, A3 a A4 znamenajú rôzne aminokyseliny), vykazovali značne nižšiu afinitu voči receptoru, čo ilustruje, že aspoň jeden z týchto dvoch predpovedaných zvyškov skutočne predstavuje dôležitú skupinu podporujúcu biologickú funkciu daného hormónu. Možno zhrnúť, že tieto výsledky demonštrujú, že spôsob podľa predloženého vynálezu umožňuje identifikáciu biologicky aktívnych skupín peptidových ligandov, ktoré sú užitočné v medicínskych chemických programoch zameraných na racionálny dizajn,
-65napríklad peptidomimetických enzýmových inhibítorov a/alebo receptorových ligandov.
Príklad 13
Predpovedanie proteín-proteín interakcií
Vynález umožňuje aj predpovedanie existencie vzájomných proteínových interakcií spôsobom, ktorý je analogický so spôsobom opísaným v predchádzajúcom príklade. Na ilustráciu sa uskutočnil skríning iónových kanálov, ako je opísaný v príklade 3, ktorý viedol k identifikácii viac ako dvoch tuctov molekúl vykazujúcich aspoň 40% inhibíciu pri testovaní v koncentrácii 5 μΜ. Chemické štruktúry týchto inhibítorov sa zostavili do zoznamu, ktorý sa analyzoval ako je opísané v príklade 12. Toto viedlo k identifikácii sérií aminokyselinových chemických determinantov a chemických determinantov odvodených z peptidovej kostry s vysokým skóre, pričom ďalšou analýzou sa zistilo, že daný kanál s najväčšou pravdepodobnosťou interaguje s inhibičným peptidom alebo proteinom špecificky obsahujúcim určitú dipeptidovú sekvenciu, označenú ako A5-A6. Je zaujímavé, že takéto inhibičné proteíny boli predtým opísané v literatúre, pričom všetky obsahovali 20 aminokyselinovú „kanál inhibujúcu“ doménu obsahujúcu presne predpovedanú Α5-Αβ dipeptidovú sekvenciu. Keďže je možné určiť, že pravdepodobnosť, že akákoľvek sekvencia 20 aminokyselín obsahuje dané sekvenčné zoskupenie dvoch zvyškov náhodou, je len 0,046, je možné odhadnúť, že pravdepodobnosť náhodného správneho predpovedania existencie dvoch rozdielnych dipeptidových sekvencii existujúcich v dvoch nepríbuzných proteínoch je v tomto a predchádzajúcom príklade menšia ako 1 ku 1097. Napriek tomu sa v oboch prípadoch urobili správne predpovede, čo demonštruje, že vynález umožňuje identifikáciu a/alebo predpovedanie existencie určitých typov proteínproteín interakcií. To je možné uskutočniť jednoducho identifikáciou sekvencie aminokyselín obsahujúcej najväčší možný chemický determinant identifikovaný z podsúboru farmakologicky aktívnych štruktúr a potom prehliadavaním sekvenčných databáz na proteíny obsahujúce danú aminokyselinovú sekvenciu. Opis tohto procesu je poskytnutý v príklade 14 nižšie. V tomto kontexte je pre
-66priemerného odborníka v oblasti zrejmé, že prístup nie je obmedzený iba na identifikáciu dipeptidových sekvencii, keďže v závislosti na štruktúrach farmakologicky aktívnych zlúčenín podrobujúcich sa analýze môžu byť detegované tripeptidové alebo aj tetrapeptidové sekvencie. Je tiež zrejmé, že podobný prístup by sa mohol použiť aj pre nepeptidové ligandy, teda, že spôsob by sa mohol adaptovať napríklad aj na detekciu uhľovodíkových sekvencii (tzn. sacharidov), nukleotidov a podobne.
Príklad 14
Identifikácia párov osamotených ligandov a receptorov
Vynález sa môže aplikovať aj na identifikáciu osamotených ligandov a/alebo párov osamotený ligand-receptor. Proces sa inicuje kompiláciou zoznamu chemických štruktúr majúcich daný účinok na proteín, o ktorý je záujem (typicky viazanie), ale pre ktorý nie sú známe žiadne ligandy v čase skúmania. Táto informácia sa môže generovať množstvom spôsobov, ako napríklad, ale bez obmedzenia na NMR štúdie, meranie konformačných zmien prostredníctvom cirkulačného dichroizmu, meranie proteín-ligand interakcií prostredníctvom povrchovej plazmónovej rezonancie alebo, v prípade osamoteného receptora, uskutočňovaním testov s konštitutívne aktivovanými mutantami daného receptora.
Na ilustráciu tohto konceptu predpokladajme, že experimenty typu opísaného vyššie sa uskutočňujú na osamotenom receptore, pričom výsledkom sú nižšie znázornené štruktúry:
-67ΗΟ
Toto je hypotetický zoznam štruktúr analyzovaný z hľadiska biologicky aktívnych chemických determinantov. Deväť štruktúr znázornených vyššie sa analyzovalo podľa vynálezu, ako je opísané v príklade 12, použitím vyššie uvedeného zoznamu aminokyselinových chemických determinantov a chemických determinantov odvodených z peptidovej kostry.
Analýza štruktúr, ako je opísaná v príklade 12, vedie k identifikácii množstva aminokyselinových chemických determinantov a chemických determinantov odvodených z peptidovej kostry, s hodnotami skóre vyššími ako 1. Príklady takýchto determinantov sú znázornené nižšie, spolu s ich zodpovedajúcimi hodnotami skóre:
Tieto sú príkladmi chemických determinantov s vysokými hodnotami skóre, identifikovanými v prvom kole analýzy. Zbierka hypotetických receptorových ligandov sa analyzovala podľa vynálezu prostredníctvom vypočítania skóre chemických determinantov znázornených na prvom paneli príkladu 12, ako aj pre množstvo iných, s funkciou na vypočítavanie skóre (IV). Hodnoty vyššie ako jedna indikovali, že pravdepodobnosť, že sa determinant nachádza v podsúbore ligandov len náhodou je menšia ako 1 ku 20. Vyššie sú znázornené dva chemické determinanty s vyšším skóre, ktoré boli identifikované v tomto procese.
Z týchto príkladov je zrejmé, že determinanty č. 43 a 44 sa môžu nachádzať len v chemických štruktúrach aminokyselín fenylalanínu atyrozínu. Takže sa predpokladá, že peptidy, ktoré interagujú s osamoteným receptorom, pravdepodobne obsahujú vo svojej sekvencií buď tyrozínový, alebo fenylalanínový zvyšok, a že tieto zvyšky pravdepodobne hrajú dôležitú úlohu buď pri viazaní ligandu (ligandov), a/alebo pri aktivácii receptora tohto peptidu (peptidov). Keď sa determinanty č. 43 a 44 s vysokým skóre následne opätovne analyzovali, aby sa určilo, či kombinácie s fragmentárni iných aminokyselín neposkytnú štruktúry s ešte vyšším skóre, bolo možné identifikovať fragmenty, ako napríklad determinant č. 45, znázornený na nasledujúcom paneli A.
č. 45
Skóre = 41,96
Tyr = Gly
-69Tieto panely znázorňujú chemické determinanty s vysokým skóre identifikované v druhom kole analýzy. Chemické determinanty, ako sú tie opísané predtým, sa opätovne analyzovali podľa vynálezu, aby sa určilo, či kombinácie s fragmentárni iných aminokyselín nevytvoria štruktúry s ešte vyšším skóre. Jeden z nich, označený ako determinant č. 45 (panel A), vykazoval hodnotu skóre vyššiu ako 40. Je zaujímavé, že celý determinant č. 45 sa nachádza v štruktúre dipeptidovej sekvencie Tyr-Gly (panel B), z čoho sa odvodzuje, že endogénny ligand daného osamoteného cieľa obsahuje Tyr-Gly dipeptidovú sekvenciu vo svojej primárnej štruktúre.
Keďže je zrejmé, že celý determinant č. 45 sa nachádza v štruktúre dipeptidu tyrozín-glycín (Tyr-Gly), odvodzuje sa z toho, že osamotený ligand (ligandy), ktorý hľadáme, s najväčšou pravdepodobnosťou obsahuje Tyr-Gly sekvenciu niekde vo svojej primárnej štruktúre. Na základe tejto informácie sa skrínovali databázy aminokyselinových sekvencii, aby sa identifikovali známe a/alebo osamotené ligandy obsahujúce predpovedanú Tyr-Gly sekvenciu, ktoré môžu byť po selekcii a expresii testované v originálnom biochemickom skríningovom teste. Alternatívne sa chemický determinant č. 45 môže priamo použiť na kompilovanie zbierok zlúčenín, ktoré sú potenciálnymi Tyr-Gly mimetikami.
Nakoniec treba poznamenať, že chemické štruktúry používané v tomto príklade sú v skutočnosti agonistami opiátového receptora zobratými z literatúry, a že prirodzene sa vyskytujúce agonisty opiátového receptora, dynorfín A, βendorfín, leu-enkefalín a met-enkefalín, všetky obsahujú vo svojich primárnych štruktúrach predpovedanú Tyr-Gly sekvenciu. Keďže sa ukázalo, že tyrozínový zvyšok je absolútne nevyhnutný pre opiátovú agonistickú aktivitu, tento príklad dalej ilustruje schopnosť vynálezu identifikovať biologicky aktívne skupiny receptorových ligandov. Je tiež zrejmé, že vyššie opísané odhady môžu byť zlepšené použitím alternatívnych algoritmov využívajúcich premenné x, y, za N, ako napríklad Fischerov exaktný test. V skutočnosti sa analyzovalo deväť štruktúr použitím spôsobu, pre ktorý sa nerobila žiadna adekvátna korekcia kvôli malej veľkosti vzorky, z čoho vyplýva, že hodnota skóre 41,96 pre determinant č. 45 môže byť o niečo nadhodnotená.
-70Príklad 15
Identifikácia endogénnych modulátorov liekových cieľov
Pre priemerného odborníka v oblasti je zrejmé, že vynález sa môže aplikovať aj na identifikáciu endogénych modulátorov liekových cieľov. Na ilustráciu tohto sa vyvinul funkčný test pre daný iónový kanál na liečenie neurodegenerácie. Skrínovala sa zbierka zlúčenín a výsledný zoznam inhibítorov sa analyzoval na prítomnosť biologicky aktívnych chemických determinantov ako je opísané v príklade 2. Toto viedlo k identifikácii chemického determinantu s vysokým skóre, o ktorom sa zistilo, že sa nachádza v podsúbore molekúl endogénne produkovaných v eukaryotických bunkách. Následne sa kúpili zodpovedajúce zlúčeniny a testovali sa v teste, kde sa zistilo, že daný kanál je selektívne inhibovaný submikromolárnymi koncentráciami konkrétnej podtriedy bunkového fosfolipidu, ktorá, čo je najzaujímavejšie, bola predtým spojená s apoptózou neurónov neznámym mechanizmom prostredníctvom iných skupín. Možno zhrnúť, že tieto výsledky demonštrujú, že vynález umožňuje identifikáciu endogénnych modulátorov liekových cieľov.
Príklad 16
Identifikácia falošne pozitívnych experimentálnych výsledkov
Vyvinul sa enzymatický test pre proteín kinázu považovanú za hrajúcu dôležitú úlohu v imunitnej odpovedi. Podľa vynálezu sa zostavila zbierka zlúčenín na skríning cieľa, v podstate ako je opísané v príklade 2. Zlúčeniny zbierky sa následne testovali v teste v koncentrácii 5 μΜ, čo viedlo k identifikácii 35 molekúl vykazujúcich aspoň 40% inhibíciu. Štruktúry týchto zlúčenín sa analyzovali použitím zjednodušeného variantu vzorca (II) ako funkcie na výpočet skóre, a zodpovedajúce hodnoty skóre sa priamo porovnali s hodnotami v štatistickej tabuľke, čo poskytlo odhady pravdepodobností toho, že dané chemické determinanty sa v podsúbore 35 farmakologicky aktívnych zlúčenín nachádzajú len náhodne.
Použitím prahovej hodnoty pravdepodobnosti náhodného výskytu p < 0,05 sa determinovalo, že 14 z 35 inhibítorov predstavuje s najväčšou pravdepodobnosťou
-71 falošne pozitívne výsledky. Následné opätovné testovanie 14 zlúčenín v teste potvrdilo túto hypotézu, čo ilustruje, že vynález umožňuje identifikáciu falošne pozitívnych experimentálnych výsledkov.
Príklad 17
Identifikácia falošne negatívnych experimentálnych výsledkov
Uskutočňovaním výpočtov analogických s výpočtami opísanými v príklade 16 vynález ďalej umožňuje identifikáciu falošne negatívnych experimentálnych výsledkov. Na ilustráciu tohto sa analyzovali chemické štruktúry sérií fosfatázových inhibítorov na prítomnosť farmakologicky aktívnych chemických determinantov, ako je opísané vpríklade 16. Výsledné chemické determinanty s vysokým skóre sa použili ako farmakologicky aktívne „fingerprints“ na uskutočňovanie subštrukturálnych prieskumov zoznamu chemických štruktúr zodpovedajúcich zlúčeninám, ktoré bolí pôvode testované v teste. Toto odhalilo množstvo molekúl, ktoré obsahovali jeden alebo viacero vyššie uvedených chemických determinantov, ale napriek tomu boli identifikované ako negatívne v skríningovom teste. Zodpovedajúce molekuly sa následne opätovne testovali v teste, kde sa zistilo, že viac ako 15 % z nich bolo falošne negatívnych, pričom jedna zlúčenina vykazovala až submikromolárnu inhibičnú aktivitu. Tieto výsledky jasne demonštrujú, že spôsob podľa predloženého vynálezu umožňuje identifikáciu falošne negatívnych experimentálnych výsledkov.
Príklad 18
Uskutočňovanie kvantitatívnej konfiguračnej a konformačnej analýzy
V ďalšom zlepšenom uskutočnení vynálezu je možné použiť algoritmus obsahujúci rôzne kombinácie premenných x, y, z a N na kvantitatívu konformačnú a/alebo konfiguračnú analýzu. Na ilustráciu tejto možnosti je z výsledkov uvedených v príklade 4 zrejmé, že štruktúra farmakologicky aktívneho, proteázu inhibujúceho „fingerprintu“ znázorneného na paneli B príkladu 4 nie je ani konfiguračné, ani konformačne definovaná. V skutočnosti nie je možné na základe prezentácie
-72štruktúry povedať, vo vzťahu k dvom karbonylovým alebo sulfonylovým skupinám, či sú v ŕrans-oid alebo v c/s-oid konformácii pri jednoväzbovej verzii fingerprintu, ktorý je farmakologicky aktívny, alebo ani, či ide o (E) alebo (Z) konfiguráciu fingerprintu, ktorý je aktívny v prípade verzie rovnakej štruktúry s dvojitou väzbou. Dôvodom je, že výpočty uskutočňované v príklade 4 boli nasmerované na identifikáciu chemického determinantu, ktorý je s najväčšou pravdepodobnosťou základom proteázu inhibujúcej aktivity, bez zvažovania možných konformácii a/alebo konfigurácií, ktorý takýto determinant môže zaujímať. Z pohľadu tej skutočnosti, že množstvo farmakologicky aktívnych štruktúr obsahuje dvojité väzby a/alebo kruhové systémy, ktoré slúžia na určenie konformácie chemických determinantov prostredníctvom redukovania ich celkového množstva rotovateľných väzieb, je možné použiť vynález na determináciu toho, ktoré konformácie a/alebo konfigurácie daného chemického determinantu sú s najväčšou pravdepodobnosťou farmakologicky aktíve.
Na ilustráciu tejto možnosti sa šesť (proteázu inhibujúcich) štruktúr, znázornených v príklade 4, analyzovalo vypočítavaním skóre pre série konformačne a konfiguračné definovaných chemických determinantov odvodených zo štruktúry znázornenej na paneli B príkladu 4 s funkciou na výpočet skóre (IV).
č. 46
Skóre = 36,90 jednoduchá alebo dvojitá väzba
Skóre = 14,10
Tento panel ilustruje kvantitatívnu koformačnú/konfiguračnú analýzu proteázu inhibujúceho chemického determinantu. Šesť štruktúr, znázornených v príklade 4, sa analyzovalo podľa vynálezu použitím zoznamu konformačne a konfiguračné definovaných chemických determinantov.
Chemický determinant č. 46, znázornený vyššie, vedľa chemického determinantu č. 47 s nižším skóre, získal jednu z najvyšších hodnôt skóre, z čoho
-73vyplýva, že (Z) konfigurácia verzie fingerprintu s dvojitou väzbou je pravdepodobnejšie výhodnejším usporiadaním nachádzajúcim sa v chemických štruktúrach daných proteázových inhibítorov. Táto hypotéza sa následne overila ďalším zameraným vysoko účinným skríningom, ktorý poskytol množstvo proteázových inhibítorov, v ktorých bol farmakologicky aktívny fingerprint skutočne v konfigurácii (Z) alebo v cis konfigurácii, a len veľmi málo proteázových inhibítorov, pri ktorých to tak nebolo.
Možno zhrnúť, že tieto výsledky demonštrujú, že spôsob podľa predloženého vynálezu umožňuje identifikáciu biologicky aktívnych konformácií a/alebo konfigurácií chemických determinatov. Nakoniec je zrejmé, že takéto výpočty sa môžu uskutočňovať s množstvom alternatívnych algoritmov využívajúcich rôzne kombinácie premenných x, y, z a N. V tomto kontexte je vhodné poznamenať, že vyššie opísané odhady sa môžu ešte posilniť zahrnutím ďalších premenných do rôznych funkcií na výpočet skóre, ako napríklad, ale bez obmedzenia na premenné, ktoré berú do úvahy farmakologický potenciál chemických štruktúr.
Príklad 19
Uskutočňovanie prieskumov podobnosti
Z predchádzajúcich príkladov je zrejmé, že koncept molekulárnej podobnosti, z pohľadu spôsobu podľa predloženého vynálezu, sa striktne líši od pohľadu všeobecne akceptovaného významu tohto termínu. Napríklad, zlúčeniny v hypotetickom zozname podľa príkladu 14 sú veľmi nepodobné, až do takej miery, že neexistuje vhodný spôsob, prostredníctvom ktorého je možné klasifikovať týchto deväť molekúl do jednej chemickej triedy použitím klasických zoskupovacích techník. Napriek tomu sme v príklade 14 ukázali, že tieto zlúčeniny sú v skutočnosti extrémne podobné, keďže zahŕňajú aspoň raz sa vyskytujúci chemický determinant, ktorý je reprezentatívnym fragmentom aminokyseliny tyrozínu, pozri tento panel:
Tieto sú fragmentárni aminokyselinového tyrozínu nachádzajúcimi sa v štruktúrach deviatich opiátových receptorových agonistov. Vyššie uvedené štruktúry sú do takej miery nepodobné, že je ťažké zostaviť ich do jedinej chemickej rodiny použitím klasických zoskupovacích techník. Napriek tomu sú veľmi podobné v zmysle predloženého vynález, keďže všetky obsahujú aspoň jeden fragment chemického determinantu definovaného aminokyselinovým tyrozínom, ktorého prítomnosť je tučné zvýraznená.
Takže vynález je možné jednoducho použiť na meranie molekulovej podobnosti a/alebo na porovnávanie podobností, ktoré môžu existovať medzi rôznymi súbormi chemických zlúčenín. Stručne, na ilustráciu tohto konceptu, je zrejmé, že jedna alebo viacero referenčných molekúl sa môže vybrať zo zoznamu chemických štruktúr a analyzovať na prítomnosť určitých chemických determinantov, ktoré môžu byť po identifikácii použité na uskutočňovanie jedného
-75alebo viacerých subštukturálnych prieskumov v jednej alebo viacerých nových molekulách, aby sa určilo, či sú navzájom podobné. Prostredníctvom určenia skóre pre zodpovedajúce chemické determinanty s funkciou na výpočet skóre opísanou v predchádzajúcich príkladoch, a prostredníctvom určenia skóre nových chemických štruktúr napríklad na základe množstva rozličných determinantov, ktoré môžu obsahovať, je možné priradiť testovaným molekulám také hodnoty, ktoré reflektujú stupeň podobnosti s pôvodným súborom referenčných zlúčenín. Tento proces je veľmi užitočný pri navrhovaní zameraných zbierok zlúčenín na hľadanie liečiv, keďže výskumníkovi umožňuje rýchlu identifikáciu zlúčenín veľmi podobných, v zmysle predloženého vynálezu, s farmakologicky aktívnymi referenčnými zlúčeninami.
Príklad 20
Analýza diverzity zbierok zlúčenín
Vynález sa môže ďalej použiť na analýzu diverzity zbierky zlúčenín spôsobom analogickým so spôsobom opísaným v predchádzajúcom príklade. V tomto kontexte je pre priemerného odborníka v oblasti zrejmé, že koncept chemických determinantov sa môže jednoducho použiť na porovnávanie danej zbierky zlúčenín s akoukoľvek inou. Napríklad zbierka zlúčenín môže byť vybraná na vysoko účinný skríning prostredníctvom analýzy zodpovedajúceho zoznamu chemických štruktúr podľa vynálezu, pričom sa použije referenčný súbor chemických štruktúr, ako napríklad štruktúr nachádzajúcich sa v Merck Indexe, Derwent, MDDR alebo Pharmaprojects databázy, ako referenčná zbierka liekových molekúl. V tomto prípade, sú molekuly, ktorých štruktúry v podstate obsahujú chemické determinanty s nízkym skóre, považované za „podobné liekom“, keďže v referenčných štruktúrach sa nachádza vysoký podiel rovnakých chemických determinantov. Naopak, molekuly, ktoré sú v podstate tvorené chemickými determinantami s vysokým skóre, sú považované za „nepodobné liekom“, keďže v súbore referenčných zlúčenín sú rovnaké determinanty slabo zastúpené. Táto informácia je veľmi užitočná pre navrhovanie objavovacích experimentov, keďže pomáhajú výskumníkovi pri identifikácii chemických štruktúr,
-76ktoré by mali byť zahrnuté, alebo vylúčené zo zbierky zlúčenín na skríning. V tomto kontexte je zrejmé, že na tento účel je možné použiť množstvo algoritmov obsahujúcich rôzne kombinácie premenných x, y, z a N.
Príklad 21
Špeciálne algoritmy
Je zrejmé, že predchádzajúce príklady neposkytujú vyčerpávajúci zoznam všetkých algoritmov využívajúcich rôzne kombinácie premenných x, y, z a N, ktoré môžu byť použité na uskutočňovanie diskrétnych subštrukturálnych analýz. V tomto kontexte je pre priemerného odborníka v oblasti zrejmé, že sa môžu použiť aj funkcie na výpočet skóre (XII), (XIII) a (XIV) na riešenie množstva otázok prezentovaných v predchádzajúcich príkladoch. V skutočnosti, v niektorých prípadoch je ešte vhodnejšie, v štatistickom zmysle, využiť jeden z týchto vzorcov namiesto vzorcov explicitne uvedených v príkladoch. Avšak, keďže je vynález primárne navrhnutý na identifikáciu chemických determinantov nachádzajúcich sa v zozname chemických štruktúr, ktoré sú s najväčšou pravdepodobnosťou základom daného biologického účinku, primárne sme sa zamerali na relatívne určovanie skóre a následné zoradenie chemických determinantov podľa hodnoty skóre. Napriek tomu, sú nižšie uvedené vzorce (XII), (XIII) a (XIV) poskytnuté pre prípad, že: a) pre malý súbor vzoriek je potrebný presný odhad pravdepodobnosti náhodného výskytu (pozri XII, kde s zodpovedá najnižšej hodnote medzi premennými x, (y-x), (z-x) a (N-y-z+x); b) v príklade 8 sa zdá vhodnejší proporcionálne zvažovaný odhad simultánnych podielov dvoch determinantov (pozri XIII, kde d zodpovedá množstvu separátnych chemických determinantov); alebo c) sa považuje za dôležité odhadnúť nadradenosť účinkov, keď sa hodnotia simultánne podiely dvoch prepojených chemických determinantov (pozri XIV). V tomto kontexte sú definície premenných x, y, z a N rovnaké, ako boli opísané vyššie.
(XII)
Skóre yl (N- y)! z! (N-z)!
<x! (y - x)! (z - x)! (N-y-z+x)! N!,
-77(XIII) (XIV)
Skóre = i=1
Nx-yz . N .
Skóre = [^z(N-z)y(N-y/j (|y + Z-|^-l)2 (N-y-z + 2x)
Nakoniec, pre priemerného odborníka v oblasti je tiež zrejmé, že použitie určitých premenných vo funkciách na výpočet skóre a/alebo algoritmoch navrhnutých na identifikáciu biologicky aktívnych chemických determinantov, ale nie explicitne opísaných v predchádzajúcich prípadoch, môže byť matematicky ekvivalentné použitiu rôznych kombinácií premenných x, y, z a N. Na ilustráciu tohto, je funkcia na výpočet skóre využívajúca premennú q, definovanú ako predstavujúcu počet inaktívnych molekúl, ktorých chemické štruktúry obsahujú daný chemický determinant, ekvivalentná využitiu x a y, keďže q = y-x. Podobne, funkcia na výpočet skóre využívajúca premennú r, definovanú ako reprezentujúcu celkový počet aktívnych zlúčenín, ktoré neobsahujú daný chemický determinant, je algebrický ekvivalentná využitiu premenných x a z, keďže je možné jednoducho dokázať, že r =z-x. Taktiež, funkcia na výpočet skóre využívajúca premennú s, definovanú ako reprezentujúcu celkový počet inaktívnych zlúčenín, ktoré neobsahujú daný chemický determinant, je ekvivalentná použitiu premenných x, y, z a N, keďže s = N-y+x. Nakoniec, algoritmy využívajúce premennú t, respektíve u, predstavujúce celkový počet molekúl, ktorých štruktúry neobsahujú daný determinant (t), a celkový počet inaktívnych molekúl (u), sú ekvivalentné využitiu premenných n, y a/alebo z, keďže je možné jednoducho dokázať, že t =N-y a u = N-z.
Príklad 22
Mapovanie relatívnych podielov
Vynález umožňuje aj konštrukciu diagramov relatívneho podielu. Tieto diagramy sú grafickými znázorneniami chemických štruktúr, kde relatívny podiel rôznych atómov, väzieb, fragmentov a/alebo subštruktúr na danom biologickom výstupe je označený prostredníctvom hodnôt skóre vypočítaných ako je opísané
-78v predchádzajúcich príkladoch. Vo výhodnom uskutočnení spôsobu sú používané pravdepodobnostné hodnoty skóre, ako napríklad hodnoty vypočítané použitím vzorca (XII), kde P(A) predstavuje pravdepodobnosť toho, že sa chemický determinant nachádza v podsúbore biologicky aktívnych štruktúr náhodne, čo sa vypočítava použitím vzorca využívajúceho rôzne kombinácie premenných x, y, z a N, ako bolo predtým opísané.
(XII)
Skóre = [1-P(A)] -100%
V tomto kontexte je evidentné, že množstvo mier asociácie a/alebo funkcií na výpočet skóre môže byť použitých na odhadnutie P(A). Teraz budú podrobnejšie diskutované dva príklady diagramov relatívnych podielov.
molekula podielu
č. 46
Skóre = 1,2 %
OH
č. 47
Skóre = 10,4 %
č. 48
Skóre = 14,7 %
č. 49
Skóre = 12,3 % »H
H
č. 50
H
č. 51
H
č. 52
Skóre = 23,8 %
Skóre = 56,2 %
Skóre = 63,0 %
č. 53
Skóre = 92,9 %
OH
č. 55
Skóre 12,0 %
č. 54
Skóre = 98,1 %
č. 56
Skóre = 0, 3 %
č. 57
Skóre = 0,0 %
-79Vyššie uvedený panel znázorňuje danú molekulu spolu so sériou chemických determinantov obsahujúcich fragmenty tejto molekuly, pre ktoré boli vypočítané hodnoty skóre použitím vzorca (XII) a modifikácie miery asociácie (1) na determináciu P(A). Obrázok 15 poskytuje rovnakú informáciu v grafickej forme, kde determinanty sú do grafu vynesené oproti príslušným hodnotám skóre. V tomto kontexte je zrejmé, že rovnaká informácia môže byť prezentovaná vo forme pravdepodobnostných kontúrových máp, ako je znázornené na paneli nižšie:
95%
Celkovo sú takéto diagramy veľmi užitočné na navrhovanie zbierok zlúčenín, keďže pomáhajú výskumníkovi pri výbere zlúčenín na základe matematických odhadov šance byť úspešnými v danom teste, pričom sa znižuje potreba spoliehať sa na koncept molekulárne diverzity na identifikáciu nových, biologicky aktívnych, chemických sérii. Sú tiež zaujímavé v medicinálnej chémii, keďže znázornenia, ktorých jeden príklad je uvedený na paneli vyššie, jasne indikujú, ktoré časti molekuly môžu byť podstatne modifikované s minimálnym rizikom straty farmakologickej aktivity. Naopak, takéto grafy varujú toxikológa, ktoré časti toxickej zlúčeniny musia byť modifikované, aby sa eliminoval neželateľný účinok.
Na získanie máp relatívneho podielu, znázornených vyššie a na obrázku 15, sa v súlade s vynálezom vypočítavalo skóre chemických determinantov zodpovedajúcich fragmentom biologicky aktívnej molekuly použitím funkcie na výpočet skóre využívajúcej premenné x, y, z a N, ktoré umožňujú priamy odhad pravdepodobnosti náhodného výskytu v súbore aktívnych molekúl (P(A)). Zodpovedajúce P(A) hodnoty sa transformovali použitím funkcie na výpočet skóre (XII), poskytujúc pravdepodobnostnú hodnotu skóre pre každý determinant
-80odrážajúc relatívnu pravdepodobnosť toho, že zodpovedajúca chemická štruktúra je základom danej biologickej aktivity. Hodnoty môžu byť ilustrované napríklad tak, ako na obrázku 15, ktorý je grafickým znázornením hodnôt skóre pre rôzne chemické determinanty. Chemický determinant č. 54 zodpovedá lokálnemu maximu tejto série. Alebo, hodnoty môžu byť ilustrované tak ako na vyššie uvedenom paneli, ktorý je pravdepodobnostnou kontúrovou mapou indikujúcou, ktorý fragment alebo sektor danej chemickej štruktúry najpravdepodobnejšie udeľuje biologickú aktivitu (determinant č. 54 sa nachádza v oblasti ohraničenej 95% kontúrovou líniou). Iný spôsob prezentovania hodnôt je znázornený na obrázku 11.
Príklad 23
Ekvivalencia funkcií na výpočet skóre
Funkcie na výpočet skóre používané v predchádzajúcich príkladoch, všetky predstavujú spôsoby na identifikáciu chemických determinantov, ktoré sú s najväčšou pravdepodobnosťou základom daného biologického, farmakologického a/alebo toxikologického účinku. Zatiaľ čo je pre priemerného odborníka v oblasti zrejmé, že určité miery asociácie a/alebo funkcie na výpočet skóre je najlepšie použiť na riešenie len určitých typov otázok, keď sa použije ako je opísané v spôsobe podľa predloženého vynálezu, umožňuje každý vzorec identifikáciu rovnakého chemického determinantu s najvyšším skóre, ktorý je s najväčšou pravdepodobnosťou základom daného biologického účinku. Takže vzorce prezentované v predchádzajúcich príkladoch sú funkčne ekvivalentné v zmysle diskrétnej subštrukturálnej analýzy.
Aby sa toto demonštrovalo, uskutočňovala sa analýza chemických štruktúr 131 dopamínových D2 receptorových agonistov osemkrát paralelne použitím ôsmych mier asociácie a funkcií na výpočet skóre obsahujúcich rôzne kombinácie premenných x, y, z a N, uvedené nižšie. Štúdia sa uskutočňovala ako bolo opísané vyššie, pridaním chemických štruktúr 101207 molekúl, opísaných ako bez účinku na dopamínový D2 receptor, k prvému zoznamu 131 zlúčenín, a vypočítavaním skóre série 19 chemických determinantov uvedených nižšie s funkciami na výpočet skóre (XV) a (XXIII), ktoré pre čitateľa zrejmým spôsobom predstavujú rovnaké funkcie
-81 ako tie, ktoré boli využité v množstve predchádzajúcich príkladov, a/alebo ich blízko príbuzné varianty.
C N
č. 58 č. 59 č. 60
č. 74 č. 75 č. 76
Skóre týchto chemických determinantov bolo vypočítavané s ôsmymi rôznymi funkciami na výpočet skóre. Skóre 19 chemických determinantov uvedených vyššie sa vypočítavalo použitím funkcií (XV) a (XXII) a zoznamu chemických štruktúr anotovaných pre dopamínovú D2 receptorovú agonistickú aktivitu. Použitými funkciami sú:
| (XV) | Skóre =MW(x/z) |
| (XVI) | Skóre = (x / z) - (y / N) |
| (XVII) | Skóre =Nx-yz |
| (XVIII) | x(N-y-z-x) Skoré - |
-82(XIX) (XX) (XXI) (XXII) (|Nx-yzj-N/2)2N SkOľe= z(N-z)y(N-y)
Slráre _ x(N-y-z-x)e_2Vl/x+1/(y-x)+1/(z-x)+1/(N-y-z+x) (z-x)(y-x)
Nx-yz SkOľ® ” 7z(N-z) y(N-y)
Skóre =ef(x/z)-(z-x)/(N-z)l
Obrázky 16A až16H znázorňujú zodpovedajúce diagramy relatívnych podielov. Pre chemické determinanty znázornené vyššie na paneli sa vypočítavalo skóre ako bolo predtým opísané a vynieslo sa do grafu oproti ich zodpovedajúcim hodnotám skóre. Obrázok 16A znázorňuje skóre získané s funkciou (XV), obrázok 16B znázorňuje skóre získané s funkciou (XVI), obrázok 16C znázorňuje skóre získané s funkciou (XVII), obrázok 16D znázorňuje skóre získané s funkciou (XVIII), obrázok 16E znázorňuje skóre získané s funkciou (XIX), obrázok 16F znázorňuje skóre získané s funkciou (XX), obrázok 16G znázorňuje skóre získané s funkciou (XXI) a obrázok 16H znázorňuje skóre získané s funkciou (XXII). Každá funkcia na výpočet skóre neodchylne vybrala rovnaký chemický determinant (č. 73), ako majúci najväčšiu pravdepodobnosť, že je základom biologickej aktivity.
Ako je uvedené prostredníctvom diagramov relatívnych podielov prezentovaných na obrázkoch 16A až 16H, každá z ôsmych funkcií na výpočet skóre správne identifikovala chemický determinant č. 73 ako zodpovedajúci lokálnemu maximu, vyznačujúc tak, že je to chemický motív, ktorý má najväčšiu pravdepodobnosť, že je základom dopamínovej D2 agonistickej aktivity v zozname 19 testovaných determinantov. Je zaujímavé, že rôzne funkcie na výpočet skóre neposkytovali rovnaké výsledky pri chemických determinantoch s nižším skóre, keďže determinant č. 62 bol navrhnutý z hľadiska dôležitosti pre biologickú aktivitu ako tretí vo výpočtoch použitím funkcií na výpočet skóre (XV), (XVI) a (XVII), zatiaľ čo determinant č. 63 bol zaradený ako tretí použitím funkcie na výpočet skóre (XXII), determinant č. 65 bol zaradený ako tretí použitím funkcií na výpočet skóre (XIX) a (XXI), a nakoniec, determinant č. 66 bol zaradený ako tretí, keď sa testoval s funkciami na výpočet skóre (XVIII) a (XXII).
-83Celkovo, tieto minoritné rozdiely majú malý význam pre úspešný výstup spôsobu, keďže v každom prípade sú determinanty s nižším skóre v skutočnosti fragmentárni väčšieho determinantu č. 73 s vyšším skóre (pozri vyššie uvedený panel). Takže je postačujúce priamo využiť chemický determinant č. 73 a jeho fragmenty na návrh zbierky zlúčenín na vysoko účinný skríning, keďže budú určite obsahovať štruktúry obsahujúce determinant s nižším skóre. Vzorka typu zlúčenín, ktoré by mohli byť zahrnuté do takejto zbierky je znázornená nižšie.
Tieto vzorové štruktúry sú príkladmi zlúčenín, ktoré by mohli byť vybrané na zahrnutie do zbierky zlúčenín navrhnutej na identifikáciu dopamínových D2 receptorových agonistov. Každá z vyššie znázornených štruktúr obsahuje chemický determinant č. 73 ako svoju podstatnú časť.
Možno zhrnúť, že hoci je matematické zdôvodnenie, na základe ktorého je skonštruovaných a používaných osem rôznych funkcií na výpočet skóre, v každom prípade rozdielne, všetky identifikujú rovnaký chemický determinant, ktorý je s najväčšou pravdepodobnosťou základom biologickej aktivity. Takže algoritmy obsahujúci rôzne kombinácie premenných x, y, z a N alebo q, r, s, t a u, ako boli uvedené vyššie, sú v zmysle predloženého vynálezu funkčne ekvivalentné.
-84Príklad 24
Nástroje na vyhľadávanie liekov založené na informatike
Z predchádzajúcich príkladov je zrejmé, že predložený vynález sa môže zahrnúť do jednej alebo viacerých sérií postupov, ako napríklad, ale bez obmedzenia na počítačové programy navrhnuté na zvýšenie účinnosti vysoko účinného skríningu, na objavovanie zlúčenín, chémiu zachytávania tipov, progresiu zlúčenín a/alebo optimalizáciu tipov. Takéto postupy alebo programy sú výhodne navrhnuté na riadenie strojov a/alebo robotických systémov, ktoré uskutočňujú liekový skríning, selekciu zlúčenín, generovania súborov a/alebo chemickú syntézu, pod dohľadom, semi-autonémne alebo úplne autonómnym spôsobom. Takéto postupy zahŕňajú, ale nie sú obmedzené na nasledujúce príklady, ktoré tvoria výhodné uskutočnenia predloženého vynálezu:
Spôsob, ktorým sa analyzujú chemické štruktúry, anotované zo zodpovedajúcimi experimentálnymi výsledkami, a v súlade s vynálezom sa identifikujú biologicky aktívne chemické determinanty.
Spôsob, ktorým sa podľa vynálezu identifikujú biologicky aktívne chemické determinanty, sa použije na uskutočňovanie prieskumov v chemických databázach, virtuálnych alebo iných, aby sa identifikovali zlúčeniny, biologicky aktívne reakčné činidlá, reakčné produkty, medziprodukty alebo iné, ktoré s najväčšou pravdepodobnosťou vykazujú danú farmakologickú, biochemickú, toxikologickú a/alebo biologickú vlastnosť.
Spôsob, ktorým sa biologicky aktívne chemické determinanty identifikované podľa vynálezu ukladajú do registra spolu so priradenými experimentálnymi údajmi a/alebo hodnotami skóre, v elektronickej forme alebo v inej forme, a pravidelne sa obnovujú alebo neobnovujú, ktoré slúžia ako schránka štrukturálnych informácií na použitie pri rozhodovacom procese, automatizovanom alebo neautomatizovanom, na selekciu zlúčeniny, série a/alebo skeletu na vysoko účinný skríning, medicinálnu chémiu a/alebo optimalizáciu tipu, pričom uvedené experimentálne výsledky a hodnoty skóre sa týkajú akejkoľvek danej farmakologickej, biochemickej, toxikologickej a/alebo biologickej vlastnosti.
-85Spôsob, ktorým sa vynález, ako je opísaný v ktoromkoľvek z predchádzajúcich príkladov, používa na identifikáciu farmakologických modulátorov liekových cieľov, ako napríklad, ale bez obmedzenia receptorových ligandov, kinázových inhibítorov, modulátorov iónových kanálov, proteázových inhibítorov, fosfatázových inhibítorov a ligandov steroidných receptorov.
Spôsob, ktorým sa vynález, ako je opísaný v ktoromkoľvek z predchádzajúcich príkladov, priamo používa alebo využíva v počítačovom programe navrhnutom na analýzu chemických štruktúr, aby sa zvýšil potenciál chemickej série, zvýšila selektivita chemickej série, na návrh zlúčenín s multiplicitnými farmakologickým účinkami, na predpovedanie potenciálnych sekundárnych farmakologických aktivít molekuly, na predpovedanie potenciálnych toxikologických aktivít molekuly, na identifikáciu biologicky aktívnych skupín receptorových ligandov, na predpovedanie potenciálnych proteín-proteín interakcií, na identifikáciu párov osamelý ligand - receptor a/alebo na identifikáciu endogénnych modulátorov liekových cieľov. Posledné použitia sa týkajú najmä oblastí funkčných genomických a proteomických entít, pričom je možné selektovať napríklad nukleotidové a/alebo aminokyselinové sekvencie na skúmanie na základe chemických štruktúr molekúl identifikovaných v biochemickom skríningovom teste a spracovaných podľa vynálezu, ako napríklad na identifikáciu osamotených ligandov.
Spôsob, ktorým sa vynález používa buď priamo, alebo v programoch navrhnutých na identifikáciu falošne pozitívnych a/alebo falošne negatívnych experimentálnych výsledkov.
Spôsob, ktorým sa vynález používa buď priamo, alebo v programoch navrhnutých na predpovedanie potenciálnych nebezpečných účinkov molekuly na človeka, zvieratá a/alebo prostredie, ako napríklad v skríningu chemických zlúčenín na použitie v alebo ako potravinárskych aditív, v plastoch, textíliách a podobne.
Spôsob, ktorým sa vynález používa buď priamo, alebo v programe navrhnutom na uskutočňovanie konfiguračnej, konformačnej, stereochemickej, podobnostnej a/alebo diverzifikačnej analýzy.
Spôsob, ktorým sa vynález používa buď priamo, alebo v programe navrhnutom na generovanie máp relatívneho podielu a/alebo grafických zobrazení biologicky aktívnych skupín alebo chemických štruktúr.
-86Spôsob, ktorým sa ktorýkoľvek z vyššie uvedených spôsobov využíva samostatne alebo vseriálnej a/alebo paralelnej kombinácii na funkcionalizáciu nástroja informatiky, počítačového programu a/alebo expertného systému určeného na použitie na uskutočňovanie liekového, herbicídneho a/alebo pesticídneho výskumu.
Spôsob, ktorým sa ktorýkoľvek z vyššie uvedených spôsobov využíva samostatne alebo vseriálnej a/alebo paralelnej kombinácii na riadenie funkcie stroja a/alebo zariadenia, automatizovaného alebo neautomatizovaného, autonómneho alebo neautonómneho, a používajúc obnovovateľné registre chemických determinantov anotovaných s hodnotami skóre alebo nie, na použitie na racionálne generovanie chemických štruktúr, na vyhľadávanie chemických zlúčenín, racionálne generovanie experimentálnych protokolov a/alebo skríning údajov, a/alebo racionálnu selekciu výsledkov a/alebo chemických štruktúr vo farmaceutickom a/alebo poľnohospodárskom výskumnom sektore.
Iné postupy zahrnuté vynálezom je možné jednoducho získať prostredníctvom bežných znalostí priemerného odborníka v oblasti.
Claims (18)
- PATENTOVÉ NÁROKY1. Spôsob prevádzkovania počítačového systému na uskutočňovanie diskrétnej subštrukturálnej analýzy, vyznačujúci sa tým, že zahŕňa- sprístupnenie (210, 220, 410) databázy (110, 115) molekulových štruktúr, ktorú je možné prehľadávať na základe štruktúrnej informácie a biologických a/alebo chemických vlastností;- identifikáciu (220) podsúboru molekúl, majúcich danú biologickú a/alebo chemickú vlastnosť, v uvedenej databáze;- determináciu (230,420) fragmentov molekúl v danom podsubore;- pre každý fragment, výpočet (230, 430, 610-650) hodnoty skóre indikujúcej podiel príslušného fragmentu na danej biologickej a/alebo chemickej vlastnosti; a- uskutočňovanie (240, 250) procesu opätovného opakovania prostredníctvom analýzy (250) determinovaných fragmentov a vypočítaných hodnôt skóre, čím sa najprv vyselektuje aspoň jeden fragment majúci hodnotu skóre, z ktorej vyplýva vysoký podiel na uvedenej biologickej a/alebo chemickej vlastnosti, a potom opätovne opakujú kroky získavania údajov, identifikácie, determinácie a vypočítavania.
- 2. Spôsob podľa nároku 1, vyznačujúci sa tým, že krok vypočítavania hodnoty skóre zahŕňa vypočítavanie (610) počtu molekúl (x), ktoré obsahujú daný fragment, v danom podsúbore molekúl.
- 3. Spôsob podľa jedného z nárokov 1 alebo 2, vyznačujúci sa tým, že zahŕňa identifikáciu druhého podsúboru molekúl, ktoré nemajú danú biologickú a/alebo chemickú vlastnosť, v uvedenej databáze; pričom krok vypočítavania hodnoty skóre zahŕňa vypočítavanie (620) počtu molekúl (y), ktoré obsahujú daný fragment, v uvedenom podsúbore molekúl a v uvedenom druhom podsúbore molekúl.-884. Spôsob podľa jedného z nárokov 1 až 3, vyznačujúci sa tým, že krok vypočítavania hodnoty skóre zahŕňa vypočítavanie (630) počtu molekúl (z) v uvedenom podsúbore molekúl.
- 5. Spôsob podľa jedného z nárokov 1 až 4, vyznačujúci sa tým, že ďalej zahŕňa krok identifikácie druhého podsúboru molekúl, ktoré nemajú danú biologickú a/alebo chemickú vlastnosť, v uvedenej databáze, pričom krok vypočítavania skóre zahŕňa krok vypočítavania (640) celkového počtu molekúl (N) v uvedenom podsúbore a uvedenom druhom podsúbore molekúl.
- 6. Spôsob podľa jedného z nárokov 1 až 5, vyznačujúci sa tým, že proces opätovného opakovania sa uskutočňuje prostredníctvom zvolenia fragmentov nasledujúceho kola, ktoré majú väčšiu molekulovú hmotnosť, ako fragmenty predchádzajúceho kola.
- 7. Spôsob podľa jedného z nárokov 1 až 6, vyznačujúci sa tým, že ďalej zahŕňa kroky selekcie (710) fragmentu na základe vypočítaných hodnôt skóre; analýzy (810) štruktúry selektovaného fragmentu; lokalizácie (820) generalizovanej položky v štruktúre fragmentu; a nahradenia (830) generalizovanej položky generalizovaným výrazom na generovanie generickej subštruktúry.
- 8. Spôsob podľa nároku 7, vyznačujúci sa tým, že ďalej zahŕňa krok uskutočňovania (840) virtuálneho skríningu použitím generickej subštruktúry.
- 9. Spôsob podľa jedného z nárokov 1 až 8, vyznačujúci sa tým, že krok analyzovania determinovaných fragmentov a vypočítaných hodnôt skóre zahŕňa selekciu (1010) prvého fragmentu na základe vypočítaných hodnôt skóre; selekciu (1020) druhého fragmentu na základe vypočítaných hodnôt skóre; a generovanie (1030) molekulovej subštruktúry zahŕňajúcej uvedený prvý fragment a uvedený druhý fragment aplikovaním anelačnej funkcie.-8910. Spôsob podľa jedného z nárokov 1 až 9, vyznačujúci sa tým, že krok analyzovania determinovaných fragmentov a vypočítaných hodnôt skóre zahŕňa selekciu (710) aspoň jedného fragmentu na základe vypočítanej hodnoty skóre; extrakciu (720) zlúčenín z predchádzajúceho podsúboru molekúl, pričom extrahované zlúčeniny obsahujú selektovaný fragment; selektovanie (730) zlúčenín, ktoré neobsahujú selektovaný fragment, alebo zlúčenín, ktoré nie sú obsiahnuté v predchádzajúcom podsúbore molekúl, z predchádzajúceho podsúboru molekúl; a vytvorenie (740) nového podsúboru molekúl zahŕňajúceho extrahované a selektované zlúčeniny.
- 11. Spôsob podľa jedného z nárokov 1 až 10, vyznačujúci sa tým, že ďalej zahŕňa krok generovania (230) knižnice fragmentov (120) zahŕňajúcej determinované fragmenty a vypočítavanie hodnôt skóre.
- 12. Spôsob podľa jedného z nárokov 1 až 11, vyznačujúci sa tým, že databázou je súkromná databáza.
- 13. Spôsob podľa jedného z nárokov 1 až 12, vyznačujúci sa tým, že databázou je verejná databáza.
- 14. Spôsob podľa jedného z nárokov 1 až 13, v y z n a č u j ú c i sa tým, že databázou je databáza aminokyselinových a/alebo nukieokyselinových sekvencií a uvedenou biologickou a/alebo chemickou vlastnosťou je daný účinok na daný proteín.
- 15. Spôsob podľa jedného z nárokov 1 až 14, vyznačujúci sa tým, že uvedenou biologickou a/alebo chemickou vlastnosťou je farmakologická vlastnosť a spôsob sa používa na výskum liečiv.
- 16. Spôsob podľa jedného z nárokov 1 až 15, vyz n a č u j ú ci sa tým, že ďalej zahŕňa krok kompilovania (260) súboru zlúčenín, ktoré obsahujú aspoň jeden z determinovaných fragmentov.-9017. Spôsob podľa nároku 16, vyz n a č u j ú c i sa t ý m , že ďalej zahŕňa krok testovania zlúčenín uvedeného kompilovaného súboru z hľadiska danej biologickej a/alebo chemickej vlastnosti.
- 18. Počítačový programový produkt, vyznačujúci sa tým, že je usporiadaný na uskutočňovanie spôsobu podľa jedného z nárokov 1 až 17.
- 19. Knižnica fragmentov, vyznačujúca sa tým, že je generovaná uskutočňovaním spôsobu podľa jedného z nárokov 1 až 17.
- 20. Počítačový systém na uskutočňovanie diskrétnej subštrukturálnej analýzy, vyznačujúci sa tým, že obsahuje:- prostriedok (100, 110, 115) na prístup do databázy molekulových štruktúr, pričom túto databázu je možné prehliadať na základe informácie o molekulovej štruktúre a na základe biologických a/alebo chemických vlastností;- prostriedok (100, 130) na identifikáciu podsúboru molekúl, majúcich danú biologickú a/alebo chemickú vlastnosť, v uvedenej databáze;- prostriedok (100,130,135) na determináciu fragmentov molekúl v uvedenom podsúbore;- prostriedok (100, 130, 140) na výpočet, pre každý fragment, hodnoty skóre, z ktorej vyplýva podiel príslušného fragmentu na danej biologickej a/alebo chemickej vlastnosti; a- prostriedok (100, 130) na determináciu toho, či sa má uskutočňovať opätovné opakovanie, a ak áno, analyzovanie determinovaných fragmentov a vypočítaných hodnôt skóre a uskutočňovanie procesu opätovného opakovania.
- 21. Počítačový systém podľa nároku 20, vy z n a č u j ú c i sa tým, že je uspôsobený na uskutočňovanie spôsobu podľa jedného z nárokov 1 až 17.-91 22. Liečivo získateľné syntézou molekuly obsahujúcej aspoň jeden fragment determinovaný uskutočňovaním spôsobu podľa jedného z nárokov 1 až 17.1/19
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP00309114 | 2000-10-17 | ||
| PCT/EP2001/011955 WO2002033596A2 (en) | 2000-10-17 | 2001-10-16 | Method of operating a computer system to perform a discrete substructural analysis |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| SK4682003A3 true SK4682003A3 (en) | 2003-12-02 |
Family
ID=8173320
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| SK468-2003A SK4682003A3 (en) | 2000-10-17 | 2001-10-16 | Method of operating a computer system to perform a discrete substructural analysis |
Country Status (23)
| Country | Link |
|---|---|
| US (1) | US20040083060A1 (sk) |
| EP (1) | EP1366440A2 (sk) |
| JP (2) | JP2004512603A (sk) |
| KR (1) | KR20030059196A (sk) |
| CN (1) | CN1264110C (sk) |
| AU (2) | AU1502802A (sk) |
| BG (1) | BG107717A (sk) |
| BR (1) | BR0114987A (sk) |
| CA (1) | CA2423672A1 (sk) |
| CZ (1) | CZ20031090A3 (sk) |
| EA (1) | EA005286B1 (sk) |
| EE (1) | EE200300150A (sk) |
| HR (1) | HRP20030240A2 (sk) |
| HU (1) | HUP0302507A3 (sk) |
| IL (1) | IL155332A0 (sk) |
| MX (1) | MXPA03003422A (sk) |
| NO (1) | NO20031730D0 (sk) |
| PL (1) | PL364772A1 (sk) |
| SK (1) | SK4682003A3 (sk) |
| UA (1) | UA79231C2 (sk) |
| WO (1) | WO2002033596A2 (sk) |
| YU (1) | YU25603A (sk) |
| ZA (1) | ZA200302395B (sk) |
Families Citing this family (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2005069188A1 (ja) * | 2003-12-26 | 2005-07-28 | Dainippon Sumitomo Pharma Co., Ltd. | 化合物および蛋白質間の相互作用を予測するシステム |
| WO2005091169A1 (en) * | 2004-03-05 | 2005-09-29 | Applied Research Systems Ars Holding N.V. | Method for fast substructure searching in non-enumerated chemical libraries |
| JP2006090733A (ja) * | 2004-09-21 | 2006-04-06 | Fuji Photo Film Co Ltd | 化合物抽出装置およびプログラム |
| EP1762954B1 (en) * | 2005-08-01 | 2019-08-21 | F.Hoffmann-La Roche Ag | Automated generation of multi-dimensional structure activity and structure property relationships |
| JP5512077B2 (ja) * | 2006-11-22 | 2014-06-04 | 株式会社 資生堂 | 安全性評価方法、安全性評価システム及び安全性評価プログラム |
| CN102282560B (zh) * | 2008-12-05 | 2015-08-19 | 狄克雷佩特公司 | 用于产生马库什结构专利权利要求内的虚拟化合物链接库的方法 |
| CN102043864A (zh) * | 2010-12-30 | 2011-05-04 | 中山大学 | 中药心血管毒性分析的计算机操作方法及其系统 |
| US20140032198A1 (en) * | 2011-04-11 | 2014-01-30 | Jingbo Yan | Application of multidimensional matrix for drug moleculas design and the methodologies for drug molecular design |
| CN102262715B (zh) * | 2011-06-01 | 2013-09-11 | 山东大学 | Bcl-2蛋白抑制剂三维定量构效关系模型的构建方法及应用 |
| ES2392915B1 (es) * | 2011-06-03 | 2013-09-13 | Univ Sevilla | Compuestos bioactivos polifenolicos conteniendo azufre o selenio y sus usos |
| US9946847B2 (en) | 2012-09-22 | 2018-04-17 | Bioblocks Inc. | Libraries of compounds having desired properties and methods for making and using them |
| CN103049674A (zh) * | 2013-01-26 | 2013-04-17 | 北京东方灵盾科技有限公司 | 一种化学药物hERG钾离子通道阻断作用的定性预测方法及其系统 |
| US9424517B2 (en) | 2013-10-08 | 2016-08-23 | Baker Hughes Incorporated | Methods, systems and computer program products for chemical hazard evaluation |
| US9799006B2 (en) | 2013-10-08 | 2017-10-24 | Baker Hughes Incorporated | Methods, systems and computer program products for chemical hazard evaluation |
| US10975412B2 (en) | 2015-05-07 | 2021-04-13 | University Of Kentucky Research Foundation | Method for designing compounds and compositions useful for targeting high stoichiometric complexes to treat conditions, including treatment of viruses, bacteria, and cancers having acquired drug resistance |
| EP3206145A1 (en) * | 2016-02-09 | 2017-08-16 | InnovativeHealth Group SL | Method for producing a topical dermal formulation for cosmetic use |
| WO2018220368A1 (en) * | 2017-05-30 | 2018-12-06 | Gtn Ltd | Tensor network machine learning system |
| WO2019079580A1 (en) * | 2017-10-19 | 2019-04-25 | Schrodinger, Inc. | PREDICTING AN ACTIVE ASSEMBLY OF COMPOUNDS HAVING ALTERNATIVE HEARTS |
| EP3850632A4 (en) * | 2018-09-13 | 2022-06-29 | Cyclica Inc. | Method and system for predicting properties of chemical structures |
| WO2020054839A1 (ja) * | 2018-09-14 | 2020-03-19 | 富士フイルム株式会社 | 化合物の合成適性の評価方法、化合物の合成適性の評価プログラム及び化合物の合成適性の評価装置 |
| US11580275B1 (en) * | 2018-12-18 | 2023-02-14 | X Development Llc | Experimental discovery processes |
| EP3712897A1 (en) * | 2019-03-22 | 2020-09-23 | Tata Consultancy Services Limited | Automated prediction of biological response of chemical compounds based on chemical information |
| CN110728078B (zh) * | 2019-11-14 | 2022-11-25 | 吉林大学 | 一种基于胶粘剂化学特性的粘接结构在全服役温度区间下的力学性能的预测方法 |
| CN111354424B (zh) * | 2020-02-27 | 2023-06-23 | 北京晶泰科技有限公司 | 一种潜在活性分子的预测方法、装置和计算设备 |
| WO2021229454A1 (en) * | 2020-05-14 | 2021-11-18 | Insilico Medicine Ip Limited | Retrosynthesis-related synthetic accessibility |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6081766A (en) * | 1993-05-21 | 2000-06-27 | Axys Pharmaceuticals, Inc. | Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics |
| US5463564A (en) * | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
| AU3001500A (en) * | 1999-02-19 | 2000-09-04 | Bioreason, Inc. | Method and system for artificial intelligence directed lead discovery through multi-domain clustering |
| AU4565600A (en) * | 1999-06-18 | 2001-01-09 | Synt:Em (S.A.) | Identifying active molecules using physico-chemical parameters |
-
2001
- 2001-10-16 PL PL01364772A patent/PL364772A1/xx not_active Application Discontinuation
- 2001-10-16 IL IL15533201A patent/IL155332A0/xx unknown
- 2001-10-16 EE EEP200300150A patent/EE200300150A/xx unknown
- 2001-10-16 SK SK468-2003A patent/SK4682003A3/sk not_active Application Discontinuation
- 2001-10-16 UA UA2003043420A patent/UA79231C2/uk unknown
- 2001-10-16 EP EP01983556A patent/EP1366440A2/en not_active Withdrawn
- 2001-10-16 HU HU0302507A patent/HUP0302507A3/hu unknown
- 2001-10-16 MX MXPA03003422A patent/MXPA03003422A/es active IP Right Grant
- 2001-10-16 AU AU1502802A patent/AU1502802A/xx active Pending
- 2001-10-16 KR KR10-2003-7005331A patent/KR20030059196A/ko not_active Ceased
- 2001-10-16 CA CA002423672A patent/CA2423672A1/en not_active Abandoned
- 2001-10-16 BR BR0114987-3A patent/BR0114987A/pt not_active Application Discontinuation
- 2001-10-16 WO PCT/EP2001/011955 patent/WO2002033596A2/en not_active Ceased
- 2001-10-16 EA EA200300475A patent/EA005286B1/ru not_active IP Right Cessation
- 2001-10-16 ZA ZA200302395A patent/ZA200302395B/en unknown
- 2001-10-16 CZ CZ20031090A patent/CZ20031090A3/cs unknown
- 2001-10-16 CN CNB018207227A patent/CN1264110C/zh not_active Expired - Fee Related
- 2001-10-16 YU YU25603A patent/YU25603A/sh unknown
- 2001-10-16 AU AU2002215028A patent/AU2002215028B2/en not_active Ceased
- 2001-10-16 JP JP2002536914A patent/JP2004512603A/ja not_active Withdrawn
- 2001-10-16 US US10/399,329 patent/US20040083060A1/en not_active Abandoned
- 2001-10-16 HR HR20030240A patent/HRP20030240A2/hr not_active Application Discontinuation
-
2003
- 2003-04-10 BG BG107717A patent/BG107717A/bg unknown
- 2003-04-14 NO NO20031730A patent/NO20031730D0/no not_active Application Discontinuation
-
2006
- 2006-12-04 JP JP2006327405A patent/JP2007137887A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| KR20030059196A (ko) | 2003-07-07 |
| HK1061911A1 (en) | 2004-10-08 |
| HUP0302507A2 (hu) | 2003-11-28 |
| CA2423672A1 (en) | 2002-04-25 |
| AU1502802A (en) | 2002-04-29 |
| US20040083060A1 (en) | 2004-04-29 |
| BG107717A (bg) | 2004-01-30 |
| IL155332A0 (en) | 2003-11-23 |
| YU25603A (sh) | 2005-07-19 |
| UA79231C2 (en) | 2007-06-11 |
| EA005286B1 (ru) | 2004-12-30 |
| EE200300150A (et) | 2003-08-15 |
| NO20031730L (no) | 2003-04-14 |
| CN1493051A (zh) | 2004-04-28 |
| HRP20030240A2 (en) | 2005-02-28 |
| ZA200302395B (en) | 2004-03-29 |
| EA200300475A1 (ru) | 2003-10-30 |
| PL364772A1 (en) | 2004-12-13 |
| WO2002033596A3 (en) | 2003-10-02 |
| CZ20031090A3 (cs) | 2004-01-14 |
| MXPA03003422A (es) | 2004-05-04 |
| JP2004512603A (ja) | 2004-04-22 |
| JP2007137887A (ja) | 2007-06-07 |
| NO20031730D0 (no) | 2003-04-14 |
| WO2002033596A2 (en) | 2002-04-25 |
| AU2002215028B2 (en) | 2007-11-15 |
| CN1264110C (zh) | 2006-07-12 |
| BR0114987A (pt) | 2004-02-03 |
| EP1366440A2 (en) | 2003-12-03 |
| HUP0302507A3 (en) | 2004-05-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| SK4682003A3 (en) | Method of operating a computer system to perform a discrete substructural analysis | |
| Schenone et al. | Target identification and mechanism of action in chemical biology and drug discovery | |
| AU2002215028A1 (en) | Method of operating a computer system to perform a discrete substructural analysis | |
| Merlot et al. | Chemical substructures in drug discovery | |
| Kubinyi | Combinatorial and computational approaches in structure-based drug design | |
| von Korff et al. | Comparison of ligand-and structure-based virtual screening on the DUD data set | |
| Fiser | Comparative protein structure modelling | |
| Mannhold et al. | Advanced computer-assisted techniques in drug discovery | |
| Bajorath | Computational analysis of ligand relationships within target families | |
| Oprea et al. | Chemical information management in drug discovery: Optimizing the computational and combinatorial chemistry interfaces | |
| Pinzi et al. | Selection of protein conformations for structure-based polypharmacology studies | |
| Lim et al. | Fragment pose prediction using non-equilibrium candidate Monte Carlo and molecular dynamics simulations | |
| Lauria et al. | Drugs polypharmacology by in silico methods: new opportunities in drug discovery | |
| Kauvar et al. | Protein affinity map of chemical space | |
| Amaravadhi et al. | Revisiting de novo drug design: receptor based pharmacophore screening | |
| JP2004500614A (ja) | レセプタ選択性マッピング | |
| Koch et al. | Identifying and evaluating understudied protein kinases using biological and chemical criteria | |
| SHARMA et al. | Molecular docking: an explanatory approach in structure-based drug designing and discovery | |
| Kairys et al. | Using protein homology models for structure‐based studies: approaches to model refinement | |
| JP4688467B2 (ja) | 受容体−リガンド安定複合体構造探索方法 | |
| Scharbert et al. | Innovative strategies for modeling peptide–protein interactions and rational peptide drug design | |
| Nicolotti et al. | Estimation of the binding free energy by Linear Interaction Energy models | |
| Gomase et al. | Kinomics | |
| Schnur et al. | Methods for combinatorial and parallel library design | |
| Koby et al. | High-throughput binding free energy simulations: Applications in drug discovery |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FC9A | Refused patent application |