CN102799779B - 一种药物分子形状的比较方法 - Google Patents
一种药物分子形状的比较方法 Download PDFInfo
- Publication number
- CN102799779B CN102799779B CN201210245107.3A CN201210245107A CN102799779B CN 102799779 B CN102799779 B CN 102799779B CN 201210245107 A CN201210245107 A CN 201210245107A CN 102799779 B CN102799779 B CN 102799779B
- Authority
- CN
- China
- Prior art keywords
- molecule
- volume
- gaussian
- atom
- superposition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及药物分子的设计和筛选,特别是一种分子体积计算方法及两分子的形状比较方法。所述方法包括:读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球;计算每对高斯球组的叠合体积;计算每个高斯球的权重;计算第一分子的自身叠合体积,以第一分子的自身叠合体积作为第一分子的体积。本发明可应用于分子形状的数学表达、药物分子间形状比较、药物分子药效团比较,这些比较方法用于药物分子的虚拟筛选。
Description
技术领域
本发明涉及药物分子的设计和筛选,特别是一种药物分子形状的比较方法。
背景技术
两个分子的三维形状和药效团(分子中具有特定性质的原子集团)的彼此匹配和定量比较是药物设计中主要方法。分子体积与形状相关,而形状决定分
子的物理化学性质,而这种性质决定分子的生物活性。
传统上,分子的形状通过一组相互叠合的硬球模型计算,每个硬球对应一个原子,而球的半径为原子的范德华半径。每个硬球对应的体积密度函数在球内为1,而球外则为0。这样的体积密度可由单个原子硬球体积密度展开为下面的公式(1):
其中fi(r)为原子i的体积密度。如图1所示,一个双原子分子的体积等于两个原子体积的和减去它们之间的叠合体积,即V=VA+VB-VAB。对于三原子分子,则由多个“包含”与“排除”交替项组成:V=VA+VB+VC-VAB-VAC-VBC+VABC。对于任意分子,其体积也为一系列“包含”与“排除”交替项组成,用下述公式(2)计算:
其中vi为原子i的体积,vij为原子i和j的(二阶)叠合体积,vijk为原子i,j及k的(三阶)叠合体积,依此类推。对于一个N个原子的分子,以上求和一般要进行到N-1阶原子的叠合。
运用上述方法计算分子形状的主要缺陷是:由于硬球模型得到的体积对原子坐标导数的不连续性,导致计算时间加长,精度下降。
发明内容
本发明提供一种药物分子形状的比较方法,以解决现有技术计算分子体积时间较长,精度不高的技术问题。
采用的技术方案如下:
一种分子体积计算方法,所述方法包括:
步骤11,读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
步骤12,根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
步骤13,计算每对高斯球组的叠合体积,其中第i j组高斯球组包括第i个高斯球和第j个高斯球,第i j组高斯球组的叠合体积为vij;
步骤14,计算每个高斯球的权重,第i个高斯球的权重vi为第i个高斯球的体积,k为一个常数;
步骤15,计算第一分子的自身叠合体积为以第一分子的自身叠合体积作为第一分子的体积,其中wi为第i个高斯球的权重,wj为第j个高斯球的权重,vij为第i个高斯球与第j个高斯球的叠合体积,A为第一分子所有高斯球的集合。
进一步的,k的取值为0.5至1.0之间。
一种药物分子形状的比较方法,所述方法包括:
步骤31,系统读入第一分子和第二分子的三维结构信息,计算第一分子和第二分子的自身叠合体积,具体包括:
读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第一分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第一分子中第i个高斯球和第j个高斯球,第一分子中的第ij组高斯球组的叠合体积为vij;
计算第一分子中每个高斯球的权重,第一分子中第i个高斯球的权重vi为第一分子中第i个高斯球的体积,k为一个常数;
计算第一分子的自身叠合体积为A表示第一分子所有高斯球的集合;
读入第二分子的三维结构信息,所述三维结构信息包括第二分子中每个原子的类型及其坐标数值;
根据第二分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第二分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第二分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第二分子中第i个高斯球和第j个高斯球,第二分子中的第ij组高斯球组的叠合体积为vij';
计算第二分子中每个高斯球的权重,第二分子中第i个高斯球的权重vi'为第二分子中第i个高斯球的体积,k'为一个常数;
计算第二分子的自身叠合体积为B表示第二分子所有高斯球的集合;
步骤32,计算第一分子和第二分子在多种叠合情况下的分子间体积,选择其中的最大值作为最大分子间体积;
步骤33,根据第一分子的体积、第二分子的体积和最大分子间体积计算第一分子和第二分子的相似度,以相似度作为两个分子形状的比较结果。
进一步的:
所述步骤32的分子间体积为分子间叠合体积,具体包括:
计算第一分子和第二分子在多种叠合情况下的分子间叠合体积作为分子间体积,其中vij″为第一分子中第i个原子与第二分子中第j个原子的叠合体积,选择其中的最大值V12 Max作为最大分子间体积;
所述步骤33具体包括:
计算第一分子和第二分子的相似度以相似度S12作为两个分子形状的比较结果。
进一步的:
所述步骤32的分子间体积为第一分子和第二分子的分子间综合叠合体积,具体包括:
步骤51,找出每个分子中的药效团及其位置;
步骤52,确定每个分子中的每个药效团的类型;
步骤53,计算第一分子的自身综合叠合体积其中Fij为第一分子中的第i个药效团与第j个药效团之间的叠合,且对Fij的求和仅限于同类药效团之间;
步骤54,计算第二分子的自身综合叠合体积其中Fij'为第二分子中的第i个药效团与第j个药效团之间的叠合,且对Fij'的求和仅限于同类药效团之间;
步骤55,计算第一分子和第二分子的分子间综合叠合体积其中Fij″为第一分子中的第i个药效团与第二个分子中的第j个药效团之间的叠合,且对Fij″的求和仅限于同类药效团之间;
步骤56,计算第一分子和第二分子在多种叠合情况下的分子间综合叠合体积O12作为分子间体积,选择其中的最大值O12 Max作为最大分子间体积;
所述步骤33具体包括:
计算第一分子和第二分子的相似度以相似度S12作为两个分子形状的比较结果。
更进一步的,所述k的取值为0.5至1.0之间,所述k'的取值为0.5至1.0之间。
本发明降低分子的三维形状定量比较的计算复杂度、提高计算精度。本发明可应用于分子形状的数学表达、药物分子间形状比较、药物分子药效团比较,这些比较方法用于药物分子的虚拟筛选。
附图说明
图1为分子叠合体积计算的示意图。
图2A是本发明计算得到的分子体积(GSV)与硬球模型所得值(HSV)的对比
图2B简单加和方法计算的分子体积与硬球模型所得值(HSV)的对比。
图3是本发明计算分子体积流程图。
图4是本发明计算分子最大叠合及比较形状相似度的流程图。
图5是本发明比较两个分子形状及药效团综合相似度的流程图。
图6是本发明叠合一组分子的过程图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细的说明。
本发明提出的一种分子的三维形状定量比较方法,它降低分子的三维形状定量比较的计算复杂度、提高计算精度。
对于公式(1)和公式(2)采用高斯函数gi(r)取代硬球密度函数fi(r),而公式(1)和公式(2)的其余部分保持不变。对应于分子中每个原子的高斯体积密度为:
其中r为任意一点坐标,ri为原子i的坐标,σi为该原子的范德华半径,而p为一可调参数,通常取值为2.7。由于高斯函数易于求积分和导数,降低了计算复杂度。但是,运用公式(2)计算分子形状时,高阶项的求和数目呈组合爆炸式增长,给算法的设计带来困难。因此,对公式(1)作如下近似,即将分子的体积密度简化为原子体积密度的简单加和:
这个近似简化了计算,但由于完全忽略了原子之间的体积叠合,降低了计算精度。
公式(4)计算分子自身的叠合体积高于分子实际体积,被高估的比例在2-6之间。由于计算分子形状相似度涉及分子间和分子自身的叠合体积:
采用公式(4)给相似度计算带来大的误差。通过对公式(4)的进一步修正,得到一种分子的三维形状定量比较方法。
对于任意一个由N个原子组成的分子,其形状可用一个体积密度函数表达,通过下式计算:
其中wi为原子i的权重因子,r为任意一点坐标,ri为原子i的坐标,σi为该原子的范德华半径,而可调参数P在这里取值为这样的取值可使原子高斯球与其自身的叠合体积等于原子本身体积,即4πσi 3/3。
本发明的关键是权重因子的确定。该因子最大程度地消除简单加和近似带来的误差。由于误差源为原子间相互叠合的体积在计算中被重复计算,从而使计算出的分子自身叠合体积高于其正确值数倍。权重因子是原子在分子中的环境有关的一个经验函数,这个经验函数满足如下条件:
如果该原子远离分子中的其它原子(例如,惰性气体分子仅含一个原子),其权重应为1;如果与其它原子有叠合,其值小于1,且叠合越大,则权值越小。本发明提出如下方法确定权值:
公式(7)。其中k为一普适经验参数,可通过拟合得到:k在0.5至1.0之间。依此,两个分子的分子间叠合体积按下式计算:
公式(8)。其中,wi为第一分子的第i个原子的权重,wj'为第二分子的第j个原子的权重,vij″为第一分子的第i个原子与第二分子的第j个原子的叠合体积,A表示第一分子所有原子的集合,B表示第二分子所有原子的集合。
如果第一分子和第二分子的三维结构相同,那么V12变成了分子自身的叠合体积,它应该与分子本身的体积相等。以上公式中的k常数就是通过一组分子自身叠合体积与分子通过硬球模型得到的体积拟合而得。图2A显示了通过公式(8)得到的分子自身叠合体积与分子的实际体积的对比关系,两者的相关性趋近于1。图2B显示了文献中简单加和方法得到的自身叠合体积与分子实际体积的关系,表明公式(4)的方法所计算的自身叠合体积远高于分子体积,而且两者相关性远低于图2A中本发明所得到的相关性。
由于本发明提高了分子间叠合体积的精度,因此由公式(5)计算分子间的形状相似度的精度也获得提高。
另外,权值也可作为经验参数按原子在分子中的拓扑属性(原子杂化状态,成键类型和数量,相邻原子类型等)加以确定。这样确定的权值与分子的构象没有关系,这样的特性可减少分子间的柔性叠合及分子形状相似性的柔性比较的复杂度。
实施例一:分子体积计算
如图3所示。
步骤S301,读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
步骤S302,根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同,高斯函数的具体表达式由公式(3)得到;
步骤S303,计算每对高斯球组的叠合体积,其中第i j组高斯球组包括第i个高斯球和第j个高斯球,第i j组高斯球组的叠合体积为vij,因为高斯函数的乘积仍为高斯函数,因此叠合积分可以简单地得到,将得到的叠合积分保留在一个二维数组中,以便在后面的计算中重复使用;
步骤S304,计算每个高斯球的权重,并保留在一个一维数组中,以备后用,其中第i个高斯球的权重vi为第i个高斯球的体积,k为一个常数;
步骤S305,计算第一分子的自身叠合体积为以第一分子的自身叠合体积作为第一分子的体积,其中wi为第i个高斯球的权重,wj为第j个高斯球的权重,vij为第i个高斯球与第j个高斯球的叠合体积,A为第一分子所有高斯球的集合。
实施例二:两个分子的最大叠合体积及形状相似度的计算
本实施例涉及分子间叠合体积的最大优化,其过程如图4所示。
步骤S401,系统读入第一分子和第二分子,采用实施例一的方式计算每个分子的自身叠合体积,每个原子的权值,并保留于计算机内存中。具体方式为:
读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第一分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第一分子中第i个高斯球和第j个高斯球,第一分子中的第ij组高斯球组的叠合体积为vij;
计算第一分子中每个高斯球的权重,第一分子中第i个高斯球的权重vi为第一分子中第i个高斯球的体积,k为一个常数;
计算第一分子的自身叠合体积为A表示第一分子所有高斯球的集合;
读入第二分子的三维结构信息,所述三维结构信息包括第二分子中每个原子的类型及其坐标数值;
根据第二分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第二分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第二分子中每对高斯球组的叠合体积,其中第i j组高斯球组包括第二分子中第i个高斯球和第j个高斯球,第二分子中的第i j组高斯球组的叠合体积为vij';
计算第二分子中每个高斯球的权重,第二分子中第i个高斯球的权重vi'为第二分子中第i个高斯球的体积,k'为一个常数;
计算第二分子的自身叠合体积为B表示第二分子所有高斯球的集合;
步骤S402,两个分子进行初始叠合,作为两个分子最大体积叠合的起始,事先将两个分子的重心叠合。由于对分子的叠合体积要进行最大化的优化,因此初始叠合不必十分精确。一个最简单的重心叠合就是将每个分子各原子的平均位置作为重心进行平移,使它们叠合在一起;
在叠合优化时将其中的一个分子(如第一分子)固定,将另一个分子B进行刚体旋转平移变换,使分子间叠合体积按公式(8)的计算达到最大。刚体旋转平移变换涉及六个自由度,在本实施例中,采用牛顿-拉夫森(Newton-Raphson)方法对这六个自由度进行优化,执行步骤S403;
步骤S403,对于当前的叠合,计算第一分子和第二分子的分子间叠合体积其中vij″为第一分子中第i个原子与第二分子中第j个原子的叠合体积,计算V12对第二分子中的每个原子的坐标的一阶和二阶导数,然后将各原子坐标的一阶和二阶导数转换成第二分子进行整体旋转平移变量的一阶和二阶导数,得到V12对第二分子旋转平移六个自由度的一阶和二阶导数;
步骤S404,利用牛顿-拉夫森方法求解变换第二分子旋转平移六个自由度的变化值,并依此对第二分子进行坐标变换,执行步骤S405;
步骤S405,判断收敛,如果达到收敛条件,执行步骤S406,否则执行步骤S404;
优化中一个常见的问题是多重极值,而这里要寻求的是全局最大叠合体积。解决这一问题的方案是采用多个起始叠合(初始取向),并从优化后的结果中选择最大的。通常,多个不同的起始叠合可由任意一个叠合经过沿不同的轴旋转而得。
步骤S406,保存当前起始叠合下的分子间叠合体积,如果还有未执行的起始叠合,则选择一个还未执行的起始叠合作为当前起始叠合,并执行步骤S403,否则在所有的起始叠合下得到的分子间叠合体积中的最大值V12 Max作为最大叠合体积,执行步骤S407;
步骤S407,计算第一分子和第二分子的相似度输出相似度S12作为两个分子形状的比较结果。
上述步骤S405的收敛条件通常为一阶导数的模小于某一设定的阈值。
实施例三:比较两个分子的形状和药效团综合相似度
实施例三增加了药效团对分子相似度比较的贡献,其过程如图5所示,包括:
步骤S501,系统读入第一分子和第二分子的三维结构信息,计算每个分子的自身叠合体积,每个原子的权值,找出每个分子中的药效团及其位置,并将这些结果保留于计算机内存中。每个药效团用一个半径为2埃的高斯球表示,并根据其类型标以不同颜色(例如,氢键给体为绿色,氢键受体为粉红色,疏水基团为浅蓝,正电荷为红色,负电荷为深蓝等)。为获得综合相似度,两个分子的叠合需要优化。与例二所不同的是,这里进行优化的目标函数除了两分子的叠合体积外还要加上两个分子中同类药效团之间的叠合贡献。由于一般而言同类药效团在同一分子中相对分散,因此不必考虑权重校正。用于优化的目标函数为:
公式(9)。其中V12为分子间叠合体积,由公式(8)得到,Fij″为第一分子中的第i个药效团与第二个分子中的第j个药效团之间的叠合,且对Fij″的求和仅限于同类(同色)药效团之间。
由公式(9)计算得到第一分子的自身综合叠合体积其中Fij为第一分子中的第i个药效团与第j个药效团之间的叠合,且对Fij的求和仅限于同类药效团之间,计算得到第二分子的自身综合叠合体积其中Fij'为第二分子中的第i个药效团与第j个药效团之间的叠合,且对Fij'的求和仅限于同类药效团之间;
步骤S502,两个分子进行初始叠合,作为两个分子最大体积叠合的起始,事先将两个分子的重心叠合。将每个分子各原子的平均位置作为重心进行平移,使它们叠合在一起;
在叠合优化时将其中的一个分子(如第一分子)固定,将另一个分子B进行刚体旋转平移变换,使分子间综合叠合体积按公式(9)的计算达到最大。刚体旋转平移变换涉及六个自由度,在本实施例中,采用牛顿-拉夫森(Newton-Raphson)方法对这六个自由度进行优化,执行步骤S503;
步骤S503,对于当前的叠合,计算第一分子和第二分子的分子间综合叠合体积计算O12对第二分子中的每个原子的坐标的一阶和二阶导数,然后将各原子坐标的一阶和二阶导数转换成第二分子进行整体旋转平移变量的一阶和二阶导数,得到O12对第二分子旋转平移六个自由度的一阶和二阶导数;
步骤S504,利用牛顿-拉夫森方法求解变换第二分子旋转平移六个自由度的变化值,并依此对第二分子进行坐标变换,执行步骤S505;
步骤S505,判断收敛,如果达到收敛条件,执行步骤S506,否则执行步骤S504;
优化中一个常见的问题是多重极值,而这里要寻求的是全局最大叠合体积。解决这一问题的方案是采用多个起始叠合,并从优化后的结果中选择最大的。通常,多个不同的起始叠合可由任意一个叠合经过沿不同的轴旋转而得。
步骤S506,保存当前起始叠合下的分子间综合叠合体积,如果还有未执行的起始叠合,则选择一个还未执行的起始叠合作为当前起始叠合,并执行步骤S503,否则在所有的起始叠合下得到的分子间综合叠合体积中的最大值O12 Max作为最大叠合体积,执行步骤S507;
步骤S507,计算第一分子和第二分子的相似度公式(10),输出相似度S12作为两个分子形状的比较结果。
上述步骤S505的收敛条件通常为一阶导数的模小于某一设定的阈值。
实施例四:一组分子的叠合
本例是实施例二的扩充,流程见图6,包括:
步骤S601,系统读入一组分子,计算每个分子的体积,每个分子中各原子的权重,并将结果保留于计算机内存中;
步骤S602,然后从这组分子中选择一个作为目标。目标分子的选取可以是第一个分子,或体积最大的分子,也是根据需要特别指定。选定好目标分子后,让该分子固定;
步骤S603,目标分子以外的其余分子通过实施例二公开的方式进行旋转平移与目标分子达到最大叠合。由于多极值问题,对于每个叠合分子可采用多个起始叠合位置,然后选取最佳的叠合结果;
步骤S604,将目标分子和与之叠合好的分子坐标输出。这样得到的一组叠合分子可用于三维定量构效方法(quantitative structure-activityrelationship,QSAR)分析或者药效团模型的建立。
Claims (3)
1.一种药物分子形状的比较方法,其特征在于,所述方法包括:
步骤(31),系统读入第一分子和第二分子的三维结构信息,计算第一分子和第二分子的自身叠合体积,具体包括:
读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第一分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第一分子中第i个高斯球和第j个高斯球,第一分子中的第ij组高斯球组的叠合体积为vij;
计算第一分子中每个高斯球的权重,第一分子中第i个高斯球的权重vi为第一分子中第i个高斯球的体积,k为一个常数;
计算第一分子的自身叠合体积为A表示第一分子所有高斯球的集合;
读入第二分子的三维结构信息,所述三维结构信息包括第二分子中每个原子的类型及其坐标数值;
根据第二分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第二分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第二分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第二分子中第i个高斯球和第j个高斯球,第二分子中的第ij组高斯球组的叠合体积为vij';
计算第二分子中每个高斯球的权重,第二分子中第i个高斯球的权重vi'为第二分子中第i个高斯球的体积,k'为一个常数;
计算第二分子的自身叠合体积为B表示第二分子所有高斯球的集合;
步骤(32),计算第一分子和第二分子在多种叠合情况下的分子间体积,选择其中的最大值作为最大分子间体积;
步骤(33),根据第一分子的体积、第二分子的体积和最大分子间体积计算第一分子和第二分子的相似度,以相似度作为两个分子形状的比较结果;
所述步骤(32)的分子间体积为第一分子和第二分子的分子间综合叠合体积,具体包括:
步骤(51),找出每个分子中的药效团及其位置;
步骤(52),确定每个分子中的每个药效团的类型;
步骤(53),计算第一分子的自身综合叠合体积其中Fij为第一分子中的第i个药效团与第j个药效团之间的叠合,且对Fij的求和仅限于同类药效团之间;
步骤(54),计算第二分子的自身综合叠合体积其中Fij'为第二分子中的第i个药效团与第j个药效团之间的叠合,且对Fij'的求和仅限于同类药效团之间;
步骤(55),计算第一分子和第二分子的分子间综合叠合体积其中Fij″为第一分子中的第i个药效团与第二个分子中的第j个药效团之间的叠合,且对Fij″的求和仅限于同类药效团之间;
步骤(56),计算第一分子和第二分子在多种叠合情况下的分子间综合叠合体积O12作为分子间体积,选择其中的最大值O12 Max作为最大分子间体积;
所述步骤(33)具体包括:
计算第一分子和第二分子的相似度以相似度S12作为两个分子形状的比较结果。
2.根据权利要求1所述的一种药物分子形状的比较方法,其特征在于:
所述步骤(32)的分子间体积还可以为分子间叠合体积,具体包括:
计算第一分子和第二分子在多种叠合情况下的分子间叠合体积作为分子间体积,其中vij″为第一分子中第i个原子与第二分子中第j个原子的叠合体积,选择其中的最大值V12 Max作为最大分子间体积;
所述步骤(33)具体还可以包括:
计算第一分子和第二分子的相似度以相似度S12作为两个分子形状的比较结果。
3.根据权利要求1~2任一项所述的一种药物分子形状的比较方法,其特征在于,所述k的取值为0.5至1.0之间,所述k'的取值为0.5至1.0之间。
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201210245107.3A CN102799779B (zh) | 2012-07-16 | 2012-07-16 | 一种药物分子形状的比较方法 |
| EP12881232.8A EP2752784A4 (en) | 2012-07-16 | 2012-11-16 | MOLECULAR VOLUME CALCULATION METHOD AND METHOD FOR COMPARING FORMS OF TWO MOLECULES |
| JP2014545073A JP2015502611A (ja) | 2012-07-16 | 2012-11-16 | 分子体積の計算方法及び2つの分子の形状の比較方法 |
| US14/351,978 US9811642B2 (en) | 2012-07-16 | 2012-11-16 | Methods for shape comparison between drug molecules |
| PCT/CN2012/084713 WO2014012309A1 (zh) | 2012-07-16 | 2012-11-16 | 一种分子体积计算方法及两分子的形状比较方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201210245107.3A CN102799779B (zh) | 2012-07-16 | 2012-07-16 | 一种药物分子形状的比较方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN102799779A CN102799779A (zh) | 2012-11-28 |
| CN102799779B true CN102799779B (zh) | 2015-04-22 |
Family
ID=47198887
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201210245107.3A Active CN102799779B (zh) | 2012-07-16 | 2012-07-16 | 一种药物分子形状的比较方法 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US9811642B2 (zh) |
| EP (1) | EP2752784A4 (zh) |
| JP (1) | JP2015502611A (zh) |
| CN (1) | CN102799779B (zh) |
| WO (1) | WO2014012309A1 (zh) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107657146B (zh) * | 2017-09-20 | 2020-05-05 | 广州市爱菩新医药科技有限公司 | 基于三维子结构的药物分子比较方法 |
| CN108205613A (zh) * | 2017-12-11 | 2018-06-26 | 华南理工大学 | 一种化合物分子间相似度的计算方法及系统与它们的应用 |
| CN108010101A (zh) * | 2017-12-18 | 2018-05-08 | 重庆大学 | 一种绘制分子片段2d投影图的方法 |
| CN108875298B (zh) * | 2018-06-07 | 2019-06-07 | 北京计算科学研究中心 | 基于分子形状匹配的药物筛选方法 |
| CN109637596B (zh) * | 2018-12-18 | 2023-05-16 | 广州市爱菩新医药科技有限公司 | 一种药物靶点预测方法 |
| CN109637673A (zh) * | 2018-12-18 | 2019-04-16 | 广州市爱菩新医药科技有限公司 | 一种药物虚拟筛选方法 |
| CN109712677A (zh) * | 2018-12-21 | 2019-05-03 | 广州市爱菩新医药科技有限公司 | 基于数据库的三维结构检索方法、电子设备及存储介质 |
| CN113421610B (zh) * | 2021-07-01 | 2023-10-20 | 北京望石智慧科技有限公司 | 一种分子叠合构象确定方法、装置以及存储介质 |
| CN113593655B (zh) * | 2021-08-10 | 2024-03-26 | 北京中大唯信科技有限公司 | 用于药物虚拟筛选的分子三维相似度的打分方法 |
| CN116612825B (zh) * | 2023-07-19 | 2023-10-13 | 四川省产品质量监督检验检测院 | 分子静电势等值面点云的碰撞点检测和碰撞体积计算方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1253545A2 (en) * | 2001-04-26 | 2002-10-30 | Nippon Zoki Pharmaceutical Co. Ltd. | Method and program for evaluating molecular similarity |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003019140A2 (en) * | 2001-08-23 | 2003-03-06 | Deltagen Research Laboratories, L.L.C. | Method for molecular subshape similarity matching |
| US20030167159A1 (en) * | 2001-10-04 | 2003-09-04 | California Institute Of Technology | Method for determining molecular surface areas and volumes |
-
2012
- 2012-07-16 CN CN201210245107.3A patent/CN102799779B/zh active Active
- 2012-11-16 EP EP12881232.8A patent/EP2752784A4/en not_active Withdrawn
- 2012-11-16 US US14/351,978 patent/US9811642B2/en active Active
- 2012-11-16 JP JP2014545073A patent/JP2015502611A/ja active Pending
- 2012-11-16 WO PCT/CN2012/084713 patent/WO2014012309A1/zh not_active Ceased
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1253545A2 (en) * | 2001-04-26 | 2002-10-30 | Nippon Zoki Pharmaceutical Co. Ltd. | Method and program for evaluating molecular similarity |
Non-Patent Citations (2)
| Title |
|---|
| 分子体积及表面积的Monte Carlo模拟计算;尚志才等;《物理化学学报》;19971230;第13卷(第12期);第1097-1100页 * |
| 郭明等.化合物分子体积计算方法的研究.《浙江大学学报》.2003,第30卷(第5期),554-560. * |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2014012309A1 (zh) | 2014-01-23 |
| US9811642B2 (en) | 2017-11-07 |
| US20140278284A1 (en) | 2014-09-18 |
| EP2752784A1 (en) | 2014-07-09 |
| EP2752784A4 (en) | 2015-06-10 |
| CN102799779A (zh) | 2012-11-28 |
| JP2015502611A (ja) | 2015-01-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN102799779B (zh) | 一种药物分子形状的比较方法 | |
| Jiang et al. | Drug–target affinity prediction using graph neural network and contact maps | |
| CN105205348B (zh) | 一种基于距离约束选择策略的群体构象空间优化方法 | |
| Cassioli et al. | An algorithm to enumerate all possible protein conformations verifying a set of distance constraints | |
| Sadiq et al. | Automated molecular simulation based binding affinity calculator for ligand-bound HIV-1 proteases | |
| Purohit et al. | Studies on flexibility and binding affinity of Asp25 of HIV-1 protease mutants | |
| Wang et al. | 3DSMILES-GPT: 3D molecular pocket-based generation with token-only large language model | |
| US20230377690A1 (en) | Protein sequence and structure generation with denoising diffusion probabilistic models | |
| Li | The difficulty of protein structure alignment under the RMSD | |
| CN106096328A (zh) | 一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法 | |
| Oferkin et al. | Evaluation of the docking algorithm based on tensor train global pptimization | |
| Gu et al. | DBPP-Predictor: a novel strategy for prediction of chemical drug-likeness based on property profiles | |
| Naden et al. | Rapid computation of thermodynamic properties over multidimensional nonbonded parameter spaces using adaptive multistate reweighting | |
| EP1673466B1 (en) | Method and apparatus for analysis of molecular combination based on computational estimation of electrostatic affinity using basis expansions | |
| Wang et al. | Regularized molecular conformation fields | |
| Dhakal et al. | Predicting protein-ligand binding structure using E (n) Equivariant graph neural networks | |
| Srivastava et al. | An efficient algorithm for protein structure comparison using elastic shape analysis | |
| Tabrizi et al. | Extending the solvation-layer interface condition continum electrostatic model to a linearized Poisson-Boltzmann solvent | |
| Rasouli et al. | Essential Considerations for Free Energy Calculations of RNA–Small Molecule Complexes: Lessons from the Theophylline-Binding RNA Aptamer | |
| Li et al. | Measuring the shapes of macromolecules–and why it matters | |
| Gosink et al. | Bayesian model averaging for ensemble-based estimates of solvation-free energies | |
| Rusu et al. | MDWiZ: a platform for the automated translation of molecular dynamics simulations | |
| Hao et al. | Optimal minimax variable selection for large-scale matrix linear regression model | |
| Bittrich et al. | eQuant-A Server for Fast Protein Model Quality Assessment by Integrating High-Dimensional Data and Machine Learning | |
| Ferrada et al. | A knowledge-based potential with an accurate description of local interactions improves discrimination between native and near-native protein conformations |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| TR01 | Transfer of patent right |
Effective date of registration: 20170914 Address after: 511458, Guangzhou, Guangdong province Nansha District City Ring Road, south 8, a self-made (production building) 408 Patentee after: Guangzhou city love new Pu Pharmaceutical Technology Co. Ltd. Address before: 510632 Whampoa West Road, Guangdong, Guangzhou, No. 601, No. Patentee before: Sun Yat-sen University |
|
| TR01 | Transfer of patent right |