[go: up one dir, main page]

CN102799779A - 一种分子体积计算方法及两分子的形状比较方法 - Google Patents

一种分子体积计算方法及两分子的形状比较方法 Download PDF

Info

Publication number
CN102799779A
CN102799779A CN2012102451073A CN201210245107A CN102799779A CN 102799779 A CN102799779 A CN 102799779A CN 2012102451073 A CN2012102451073 A CN 2012102451073A CN 201210245107 A CN201210245107 A CN 201210245107A CN 102799779 A CN102799779 A CN 102799779A
Authority
CN
China
Prior art keywords
molecule
volume
gaussian
atom
sphere
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102451073A
Other languages
English (en)
Other versions
CN102799779B (zh
Inventor
徐峻
严鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou City Love New Pu Pharmaceutical Technology Co Ltd
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201210245107.3A priority Critical patent/CN102799779B/zh
Priority to EP12881232.8A priority patent/EP2752784A4/en
Priority to JP2014545073A priority patent/JP2015502611A/ja
Priority to US14/351,978 priority patent/US9811642B2/en
Priority to PCT/CN2012/084713 priority patent/WO2014012309A1/zh
Publication of CN102799779A publication Critical patent/CN102799779A/zh
Application granted granted Critical
Publication of CN102799779B publication Critical patent/CN102799779B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及药物分子的设计和筛选,特别是一种分子体积计算方法及两分子的形状比较方法。所述方法包括:读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球;计算每对高斯球组的叠合体积;计算每个高斯球的权重;计算第一分子的自身叠合体积,以第一分子的自身叠合体积作为第一分子的体积。本发明可应用于分子形状的数学表达、药物分子间形状比较、药物分子药效团比较,这些比较方法用于药物分子的虚拟筛选。

Description

一种分子体积计算方法及两分子的形状比较方法
技术领域
本发明涉及药物分子的设计和筛选,特别是一种分子体积计算方法及两分子的形状比较方法。
 
背景技术
    两个分子的三维形状和药效团(分子中具有特定性质的原子集团)的彼此匹配和定量比较是药物设计中主要方法。分子体积与形状相关,而形状决定分子的物理化学性质,而这种性质决定分子的生物活性。
传统上,分子的形状通过一组相互叠合的硬球模型计算,每个硬球对应一个原子,而球的半径为原子的范德华半径。每个硬球对应的体积密度函数在球内为1,而球外则为0。这样的体积密度可由单个原子硬球体积密度展开为下面的公式(1):
Figure 2012102451073100002DEST_PATH_IMAGE002
其中fi(r)为原子i的体积密度。如图1所示,一个双原子分子的体积等于两个原子体积的和减去它们之间的叠合体积,即V=VA+VB-VAB。对于三原子分子,则由多个“包含”与“排除”交替项组成:V=VA+VB+VC-VAB-VAC-VBC+VABC。对于任意分子,其体积也为一系列“包含”与“排除”交替项组成,用下述公式(2)计算:
Figure 2012102451073100002DEST_PATH_IMAGE004
其中vi为原子i的体积,vij为原子i和j的(二阶)叠合体积,vijk为原子i,j及k的(三阶)叠合体积,依此类推。对于一个N个原子的分子,以上求和一般要进行到N-1阶原子的叠合。
运用上述方法计算分子形状的主要缺陷是:由于硬球模型得到的体积对原子坐标导数的不连续性,导致计算时间加长,精度下降。
发明内容
本发明提供一种分子体积计算方法及两分子的形状比较方法,以解决现有技术计算分子体积时间较长,精度不高的技术问题。
采用的技术方案如下:
一种分子体积计算方法,所述方法包括:
步骤11,读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
步骤12,根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
步骤13,计算每对高斯球组的叠合体积,其中第ij组高斯球组包括第i个高斯球和第j个高斯球,第ij组高斯球组的叠合体积为
Figure 2012102451073100002DEST_PATH_IMAGE006
步骤14,计算每个高斯球的权重,第i个高斯球的权重
Figure 2012102451073100002DEST_PATH_IMAGE008
Figure 2012102451073100002DEST_PATH_IMAGE010
为第i个高斯球的体积,k为一个常数;
步骤15,计算第一分子的自身叠合体积为
Figure 2012102451073100002DEST_PATH_IMAGE012
,以第一分子的自身叠合体积作为第一分子的体积,其中
Figure 2012102451073100002DEST_PATH_IMAGE014
为第i个高斯球的权重,
Figure 2012102451073100002DEST_PATH_IMAGE016
为第j个高斯球的权重,
Figure 821265DEST_PATH_IMAGE006
为第i个高斯球与第j个高斯球的叠合体积,A为第一分子所有高斯球的集合。
进一步的,k的取值为0.5至1.0之间。
一种两个分子形状的比较方法,所述方法包括:
步骤31,系统读入第一分子和第二分子的三维结构信息,计算第一分子和第二分子的自身叠合体积,具体包括:
读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第一分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第一分子中第i个高斯球和第j个高斯球,第一分子中的第ij组高斯球组的叠合体积为
Figure 1579DEST_PATH_IMAGE006
计算第一分子中每个高斯球的权重,第一分子中第i个高斯球的权重
Figure 755909DEST_PATH_IMAGE008
为第一分子中第i个高斯球的体积,k为一个常数;
计算第一分子的自身叠合体积为
Figure 2012102451073100002DEST_PATH_IMAGE018
,A表示第一分子所有高斯球的集合;
读入第二分子的三维结构信息,所述三维结构信息包括第二分子中每个原子的类型及其坐标数值;
根据第二分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第二分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第二分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第二分子中第i个高斯球和第j个高斯球,第二分子中的第ij组高斯球组的叠合体积为
Figure 2012102451073100002DEST_PATH_IMAGE020
计算第二分子中每个高斯球的权重,第二分子中第i个高斯球的权重
Figure 2012102451073100002DEST_PATH_IMAGE024
为第二分子中第i个高斯球的体积,
Figure 2012102451073100002DEST_PATH_IMAGE026
为一个常数;
计算第二分子的自身叠合体积为
Figure 2012102451073100002DEST_PATH_IMAGE028
,B表示第二分子所有高斯球的集合;
步骤32,计算第一分子和第二分子在多种叠合情况下的分子间体积,选择其中的最大值作为最大分子间体积;
步骤33,根据第一分子的体积、第二分子的体积和最大分子间体积计算第一分子和第二分子的相似度,以相似度作为两个分子形状的比较结果。
进一步的:
所述步骤32的分子间体积为分子间叠合体积,具体包括:
计算第一分子和第二分子在多种叠合情况下的分子间叠合体积
Figure 2012102451073100002DEST_PATH_IMAGE030
作为分子间体积,其中
Figure 2012102451073100002DEST_PATH_IMAGE032
为第一分子中第i个原子与第二分子中第j个原子的叠合体积,选择其中的最大值
Figure 2012102451073100002DEST_PATH_IMAGE034
作为最大分子间体积;
所述步骤33具体包括:
计算第一分子和第二分子的相似度
Figure 2012102451073100002DEST_PATH_IMAGE036
,以相似度
Figure 2012102451073100002DEST_PATH_IMAGE038
作为两个分子形状的比较结果。
进一步的:
所述步骤32的分子间体积为第一分子和第二分子的分子间综合叠合体积,具体包括:
步骤51,找出每个分子中的药效团及其位置;
步骤52,确定每个分子中的每个药效团的类型;
步骤53,计算第一分子的自身综合叠合体积
Figure 2012102451073100002DEST_PATH_IMAGE040
,其中为第一分子中的第i个药效团与第j个药效团之间的叠合体积,且对
Figure 2012102451073100002DEST_PATH_IMAGE044
的求和仅限于同类药效团之间;
步骤54,计算第二分子的自身综合叠合体积
Figure 2012102451073100002DEST_PATH_IMAGE046
,其中
Figure 2012102451073100002DEST_PATH_IMAGE048
为第二分子中的第i个药效团与第j个药效团之间的叠合体积,且对
Figure 455454DEST_PATH_IMAGE048
的求和仅限于同类药效团之间;
步骤55,计算第一分子和第二分子的分子间综合叠合体积,其中
Figure 2012102451073100002DEST_PATH_IMAGE052
为第一分子中的第i个药效团与第二个分子中的第j个药效团之间的叠合体积,且对
Figure 72249DEST_PATH_IMAGE052
的求和仅限于同类药效团之间;
步骤56,计算第一分子和第二分子在多种叠合情况下的分子间综合叠合体积
Figure 2012102451073100002DEST_PATH_IMAGE054
作为分子间体积,选择其中的最大值
Figure 2012102451073100002DEST_PATH_IMAGE056
作为最大分子间体积;
所述步骤33具体包括:
计算第一分子和第二分子的相似度
Figure 2012102451073100002DEST_PATH_IMAGE058
,以相似度
Figure 251557DEST_PATH_IMAGE038
作为两个分子形状的比较结果。
更进一步的,所述k的取值为0.5至1.0之间,所述
Figure 710702DEST_PATH_IMAGE026
的取值为0.5至1.0之间。
本发明降低分子的三维形状定量比较的计算复杂度、提高计算精度。本发明可应用于分子形状的数学表达、药物分子间形状比较、药物分子药效团比较,这些比较方法用于药物分子的虚拟筛选。
附图说明
图1为分子叠合体积计算的示意图。
图2A 是本发明计算得到的分子体积(GSV)与硬球模型所得值(HSV)的对比 
图2B 简单加和方法计算的分子体积与硬球模型所得值(HSV)的对比。
图3是本发明计算分子体积流程图。
图4是本发明计算分子最大叠合及比较形状相似度的流程图。
图5是本发明比较两个分子形状及药效团综合相似度的流程图。
图6是本发明叠合一组分子的过程图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细的说明。
本发明提出的一种分子的三维形状定量比较方法,它降低分子的三维形状定量比较的计算复杂度、提高计算精度。
对于公式(1)和公式(2)采用高斯函数g i (r)取代硬球密度函数f i (r),而公式(1)和公式(2)的其余部分保持不变。对应于分子中每个原子的高斯体积密度为:
Figure DEST_PATH_IMAGE060
,公式(3)。
其中r为任意一点坐标,r i 为原子i的坐标,
Figure DEST_PATH_IMAGE062
为该原子的范德华半径,而p为一可调参数,通常取值为2.7。由于高斯函数易于求积分和导数,降低了计算复杂度。但是,运用公式(2)计算分子形状时,高阶项的求和数目呈组合爆炸式增长,给算法的设计带来困难。因此,对公式(1)作如下近似,即将分子的体积密度简化为原子体积密度的简单加和:
Figure DEST_PATH_IMAGE064
,公式(4)。
这个近似简化了计算,但由于完全忽略了原子之间的体积叠合,降低了计算精度。
公式(4)计算分子自身的叠合体积高于分子实际体积,被高估的比例在2-6之间。由于计算分子形状相似度涉及分子间和分子自身的叠合体积:
Figure DEST_PATH_IMAGE066
,公式(5)。
采用公式(4)给相似度计算带来大的误差。通过对公式(4)的进一步修正,得到一种分子的三维形状定量比较方法。
对于任意一个由N个原子组成的分子,其形状可用一个体积密度函数表达,通过下式计算:
Figure DEST_PATH_IMAGE068
,公式(6)。
其中w i  为原子i的权重因子,r为任意一点坐标,r i 为原子i的坐标,
Figure 478807DEST_PATH_IMAGE062
为该原子的范德华半径,而可调参数P在这里取值为2,这样的取值可使原子高斯球与其自身的叠合体积等于原子本身体积,即
Figure DEST_PATH_IMAGE072
/3。
本发明的关键是权重因子的确定。该因子最大程度地消除简单加和近似带来的误差。由于误差源为原子间相互叠合的体积在计算中被重复计算,从而使计算出的分子自身叠合体积高于其正确值数倍。权重因子是原子在分子中的环境有关的一个经验函数,这个经验函数满足如下条件:
如果该原子远离分子中的其它原子(例如,惰性气体分子仅含一个原子),其权重应为1;如果与其它原子有叠合,其值小于1,且叠合越大,则权值越小。本发明提出如下方法确定权值:
Figure DEST_PATH_IMAGE074
,公式(7)。其中k为一普适经验参数,可通过拟合得到:k在0.5至1.0之间。依此,两个分子的分子间叠合体积按下式计算:
,公式(8)。其中,
Figure 667528DEST_PATH_IMAGE014
为第一分子的第i个原子的权重,
Figure DEST_PATH_IMAGE076
为第二分子的第j个原子的权重,
Figure 746343DEST_PATH_IMAGE032
为第一分子的第i个原子与第二分子的第j个原子的叠合体积,A表示第一分子所有原子的集合,B表示第二分子所有原子的集合。
如果第一分子和第二分子的三维结构相同,那么V 12 变成了分子自身的叠合体积,它应该与分子本身的体积相等。以上公式中的k常数就是通过一组分子自身叠合体积与分子通过硬球模型得到的体积拟合而得。图2A显示了通过公式(8)得到的分子自身叠合体积与分子的实际体积的对比关系,两者的相关性趋近于1。图2B显示了文献中简单加和方法得到的自身叠合体积与分子实际体积的关系,表明公式(4)的方法所计算的自身叠合体积远高于分子体积,而且两者相关性远低于图2A中本发明所得到的相关性。
由于本发明提高了分子间叠合体积的精度,因此由公式(5)计算分子间的形状相似度的精度也获得提高。
另外,权值也可作为经验参数按原子在分子中的拓扑属性(原子杂化状态,成键类型和数量,相邻原子类型等)加以确定。这样确定的权值与分子的构象没有关系,这样的特性可减少分子间的柔性叠合及分子形状相似性的柔性比较的复杂度。
 
实施例一:分子体积计算
如图3所示。
步骤S301,读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
步骤S302,根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同,高斯函数的具体表达式由公式(3)得到;
步骤S303,计算每对高斯球组的叠合体积,其中第ij组高斯球组包括第i个高斯球和第j个高斯球,第ij组高斯球组的叠合体积为
Figure 182003DEST_PATH_IMAGE006
,因为高斯函数的乘积仍为高斯函数,因此叠合积分可以简单地得到,将得到的叠合积分保留在一个二维数组中,以便在后面的计算中重复使用;
步骤S304,计算每个高斯球的权重,并保留在一个一维数组中,以备后用,其中第i个高斯球的权重
Figure 953650DEST_PATH_IMAGE008
Figure 904289DEST_PATH_IMAGE010
为第i个高斯球的体积,k为一个常数;
步骤S305,计算第一分子的自身叠合体积为,以第一分子的自身叠合体积作为第一分子的体积,其中
Figure 326229DEST_PATH_IMAGE014
为第i个高斯球的权重,
Figure 206460DEST_PATH_IMAGE016
为第j个高斯球的权重,
Figure 644395DEST_PATH_IMAGE006
为第i个高斯球与第j个高斯球的叠合体积,A为第一分子所有高斯球的集合。
 
实施例二:两个分子的最大叠合体积及形状相似度的计算
本实施例涉及分子间叠合体积的最大优化,其过程如图4所示。
步骤S401,系统读入第一分子和第二分子,采用实施例一的方式计算每个分子的自身叠合体积,每个原子的权值,并保留于计算机内存中。具体方式为:
读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第一分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第一分子中第i个高斯球和第j个高斯球,第一分子中的第ij组高斯球组的叠合体积为
计算第一分子中每个高斯球的权重,第一分子中第i个高斯球的权重
Figure 727462DEST_PATH_IMAGE008
Figure 840911DEST_PATH_IMAGE010
为第一分子中第i个高斯球的体积,k为一个常数;
计算第一分子的自身叠合体积为
Figure 766142DEST_PATH_IMAGE018
,A表示第一分子所有高斯球的集合;
读入第二分子的三维结构信息,所述三维结构信息包括第二分子中每个原子的类型及其坐标数值;
根据第二分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第二分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第二分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第二分子中第i个高斯球和第j个高斯球,第二分子中的第ij组高斯球组的叠合体积为
Figure 928133DEST_PATH_IMAGE020
计算第二分子中每个高斯球的权重,第二分子中第i个高斯球的权重
Figure 989630DEST_PATH_IMAGE022
为第二分子中第i个高斯球的体积,
Figure 873458DEST_PATH_IMAGE026
为一个常数;
计算第二分子的自身叠合体积为
Figure 901457DEST_PATH_IMAGE028
,B表示第二分子所有高斯球的集合;
步骤S402,两个分子进行起始叠合,作为两个分子最大体积叠合的起始,事先将两个分子的重心叠合。由于对分子的叠合体积要进行最大化的优化,因此起始叠合不必十分精确。一个最简单的重心叠合就是将每个分子各原子的平均位置作为重心进行平移,使它们叠合在一起;
在叠合优化时将其中的一个分子(如第一分子)固定,将另一个分子B进行刚体旋转平移变换,使分子间叠合体积按公式(8)的计算达到最大。刚体旋转平移变换涉及六个自由度,在本实施例中,采用牛顿-拉夫森(Newton-Raphson)方法对这六个自由度进行优化,执行步骤S403;
步骤S403,对于当前的起始叠合,计算第一分子和第二分子的分子间叠合体积
Figure 83040DEST_PATH_IMAGE030
,其中
Figure 210396DEST_PATH_IMAGE032
为第一分子中第i个原子与第二分子中第j个原子的叠合体积,计算
Figure DEST_PATH_IMAGE078
对第二分子中的每个原子的坐标的一阶和二阶导数, 然后将各原子坐标的一阶和二阶导数转换成第二分子进行整体旋转平移变量的一阶和二阶导数,得到
Figure 110219DEST_PATH_IMAGE078
对第二分子旋转平移六个自由度的一阶和二阶导数;
步骤S404,利用牛顿-拉夫森方法求解变换第二分子旋转平移六个自由度的变化值,并依此对第二分子进行坐标变换,执行步骤S405;
步骤S405, 判断收敛,如果达到收敛条件,执行步骤S406,否则回到步骤S403,继续执行;
优化中一个常见的问题是多重极值,而这里要寻求的是全局最大叠合体积。解决这一问题的方案是采用多个起始叠合(初始取向),并从优化后的结果中选择最大的。通常,多个不同的起始叠合可由任意一个叠合经过沿不同的轴旋转而得。
步骤S406,保存当前起始叠合下的分子间叠合体积,如果还有未执行的起始叠合,则选择一个还未执行的起始叠合作为当前起始叠合,并执行步骤S403,否则在所有的起始叠合下得到的分子间叠合体积中的最大值作为最大叠合体积,执行步骤S407;
步骤S407,计算第一分子和第二分子的相似度
Figure 164948DEST_PATH_IMAGE036
,输出相似度
Figure 650156DEST_PATH_IMAGE038
作为两个分子形状的比较结果。
上述步骤S405的收敛条件通常为一阶导数的模小于某一设定的阈值。
 
实施例三:比较两个分子的形状和药效团综合相似度
实施例三增加了药效团对分子相似度比较的贡献,其过程如图5所示,包括:
步骤S501,系统读入第一分子和第二分子的三维结构信息,计算每个分子的自身叠合体积,每个原子的权值,找出每个分子中的药效团及其位置,并将这些结果保留于计算机内存中。每个药效团用一个半径为2埃的高斯球表示,并根据其类型标以不同颜色(例如,氢键给体为绿色,氢键受体为粉红色,疏水基团为浅蓝,正电荷为红色,负电荷为深蓝等)。为获得综合相似度,两个分子的叠合需要优化。与例二所不同的是,这里进行优化的目标函数除了两分子的叠合体积外还要加上两个分子中同类药效团之间的叠合贡献。由于一般而言同类药效团在同一分子中相对分散,因此不必考虑权重校正。用于优化的目标函数为:
,公式(9)。其中为分子间叠合体积,由公式(8)得到,
Figure 235355DEST_PATH_IMAGE052
为第一分子中的第i个药效团与第二个分子中的第j个药效团之间的叠合体积,且对
Figure 32410DEST_PATH_IMAGE052
的求和仅限于同类(同色)药效团之间。
由公式(9)计算得到第一分子的自身综合叠合体积
Figure 641246DEST_PATH_IMAGE040
,其中为第一分子中的第i个药效团与第j个药效团之间的叠合体积,且对
Figure 9441DEST_PATH_IMAGE044
的求和仅限于同类药效团之间,计算得到第二分子的自身综合叠合体积
Figure 977397DEST_PATH_IMAGE046
,其中
Figure 11212DEST_PATH_IMAGE048
为第二分子中的第i个药效团与第j个药效团之间的叠合,且对
Figure 909766DEST_PATH_IMAGE048
的求和仅限于同类药效团之间;
步骤S502,两个分子进行起始叠合,作为两个分子最大体积叠合的起始,事先将两个分子的重心叠合。将每个分子各原子的平均位置作为重心进行平移,使它们叠合在一起;
在叠合优化时将其中的一个分子(如第一分子)固定,将另一个分子B进行刚体旋转平移变换,使分子间综合叠合体积按公式(9)的计算达到最大。刚体旋转平移变换涉及六个自由度,在本实施例中,采用牛顿-拉夫森(Newton-Raphson)方法对这六个自由度进行优化,执行步骤S503;
步骤S503,对于当前的起始叠合,计算第一分子和第二分子的分子间综合叠合体积,计算
Figure 851495DEST_PATH_IMAGE054
对第二分子中的每个原子的坐标的一阶和二阶导数, 然后将各原子坐标的一阶和二阶导数转换成第二分子进行整体旋转平移变量的一阶和二阶导数,得到
Figure 621873DEST_PATH_IMAGE054
对第二分子旋转平移六个自由度的一阶和二阶导数;
步骤S504,利用牛顿-拉夫森方法求解变换第二分子旋转平移六个自由度的变化值,并依此对第二分子进行坐标变换,执行步骤S505;
步骤S505, 判断收敛,如果达到收敛条件,执行步骤S506,否则执行步骤S503;
优化中一个常见的问题是多重极值,而这里要寻求的是全局最大叠合体积。解决这一问题的方案是采用多个起始叠合,并从优化后的结果中选择最大的。通常,多个不同的起始叠合可由任意一个叠合经过沿不同的轴旋转而得。
步骤S506,保存当前起始叠合下的分子间综合叠合体积,如果还有未执行的起始叠合,则选择一个还未执行的起始叠合作为当前起始叠合,并执行步骤S503,否则在所有的起始叠合下得到的分子间综合叠合体积中的最大值
Figure 871589DEST_PATH_IMAGE056
作为最大叠合体积,执行步骤S507;
步骤S507,计算第一分子和第二分子的相似度
Figure 856863DEST_PATH_IMAGE058
,公式(10),输出相似度
Figure 104304DEST_PATH_IMAGE038
作为两个分子形状的比较结果。
上述步骤S505的收敛条件通常为一阶导数的模小于某一设定的阈值。
 
实施例四:一组分子的叠合   
本例是实施例二的扩充,流程见图6,包括:
步骤S601,系统读入一组分子,计算每个分子的体积,每个分子中各原子的权重,并将结果保留于计算机内存中;
步骤S602,然后从这组分子中选择一个作为目标。目标分子的选取可以是第一个分子,或体积最大的分子,也是根据需要特别指定。选定好目标分子后,让该分子固定;
步骤S603,目标分子以外的其余分子通过实施例二公开的方式进行旋转平移与目标分子达到最大叠合。由于多极值问题,对于每个叠合分子可采用多个起始叠合位置,然后选取最佳的叠合结果;
步骤S604,将目标分子和与之叠合好的分子坐标输出。这样得到的一组叠合分子可用于三维定量构效方法(quantitative structure-activity relationship, QSAR)分析或者药效团模型的建立。

Claims (6)

1. 一种分子体积计算方法,其特征在于,所述方法包括:
步骤(11),读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
步骤(12),根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
步骤(13),计算每对高斯球组的叠合体积,其中第ij组高斯球组包括第i个高斯球和第j个高斯球,第ij组高斯球组的叠合体积为                                               
Figure 2012102451073100001DEST_PATH_IMAGE002
步骤(14),计算每个高斯球的权重,第i个高斯球的权重
Figure 2012102451073100001DEST_PATH_IMAGE004
Figure 2012102451073100001DEST_PATH_IMAGE006
为第i个高斯球的体积,k为一个常数;
步骤(15),计算第一分子的自身叠合体积为
Figure 2012102451073100001DEST_PATH_IMAGE008
,以第一分子的自身叠合体积作为第一分子的体积,其中
Figure 2012102451073100001DEST_PATH_IMAGE010
为第i个高斯球的权重,
Figure 2012102451073100001DEST_PATH_IMAGE012
为第j个高斯球的权重,
Figure 252194DEST_PATH_IMAGE002
为第i个高斯球与第j个高斯球的叠合体积,A为第一分子所有高斯球的集合。
2. 根据权利要求1所述的分子体积计算方法,其特征在于,k的取值为0.5至1.0之间。
3. 一种两个分子形状的比较方法,其特征在于,所述方法包括:
步骤(31),系统读入第一分子和第二分子的三维结构信息,计算第一分子和第二分子的自身叠合体积,具体包括:
读入第一分子的三维结构信息,所述三维结构信息包括第一分子中每个原子的类型及其坐标数值;
根据第一分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第一分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第一分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第一分子中第i个高斯球和第j个高斯球,第一分子中的第ij组高斯球组的叠合体积为
Figure 169334DEST_PATH_IMAGE002
计算第一分子中每个高斯球的权重,第一分子中第i个高斯球的权重
Figure 949071DEST_PATH_IMAGE004
为第一分子中第i个高斯球的体积,k为一个常数;
计算第一分子的自身叠合体积为
Figure 2012102451073100001DEST_PATH_IMAGE014
,A表示第一分子所有高斯球的集合;
读入第二分子的三维结构信息,所述三维结构信息包括第二分子中每个原子的类型及其坐标数值;
根据第二分子中各原子的类型得到相应的范德华半径,将三维结构信息转换为一组代表第二分子中各原子的高斯球,每个高斯球的半径与相应原子的范德华半径相同,且每个高斯球的位置与相应原子的坐标相同;
计算第二分子中每对高斯球组的叠合体积,其中第ij组高斯球组包括第二分子中第i个高斯球和第j个高斯球,第二分子中的第ij组高斯球组的叠合体积为
Figure 2012102451073100001DEST_PATH_IMAGE016
计算第二分子中每个高斯球的权重,第二分子中第i个高斯球的权重
Figure 2012102451073100001DEST_PATH_IMAGE018
为第二分子中第i个高斯球的体积,
Figure 2012102451073100001DEST_PATH_IMAGE022
为一个常数;
计算第二分子的自身叠合体积为,B表示第二分子所有高斯球的集合;
步骤(32),计算第一分子和第二分子在多种叠合情况下的分子间体积,选择其中的最大值作为最大分子间体积;
步骤(33),根据第一分子的体积、第二分子的体积和最大分子间体积计算第一分子和第二分子的相似度,以相似度作为两个分子形状的比较结果。
4. 根据权利要求3所述的一种两个分子形状的比较方法,其特征在于:
所述步骤(32)的分子间体积为分子间叠合体积,具体包括:
计算第一分子和第二分子在多种叠合情况下的分子间叠合体积
Figure 2012102451073100001DEST_PATH_IMAGE026
作为分子间体积,其中
Figure 2012102451073100001DEST_PATH_IMAGE028
为第一分子中第i个原子与第二分子中第j个原子的叠合体积,选择其中的最大值作为最大分子间体积;
所述步骤(33)具体包括:
计算第一分子和第二分子的相似度
Figure 2012102451073100001DEST_PATH_IMAGE032
,以相似度作为两个分子形状的比较结果。
5. 根据权利要求3所述的一种两个分子形状的比较方法,其特征在于:
所述步骤(32)的分子间体积为第一分子和第二分子的分子间综合叠合体积,具体包括:
步骤(51),找出每个分子中的药效团及其位置;
步骤(52),确定每个分子中的每个药效团的类型;
步骤(53),计算第一分子的自身综合叠合体积
Figure 2012102451073100001DEST_PATH_IMAGE036
,其中
Figure 2012102451073100001DEST_PATH_IMAGE038
为第一分子中的第i个药效团与第j个药效团之间的叠合体积,且对
Figure 2012102451073100001DEST_PATH_IMAGE040
的求和仅限于同类药效团之间;
步骤(54),计算第二分子的自身综合叠合体积
Figure 2012102451073100001DEST_PATH_IMAGE042
,其中为第二分子中的第i个药效团与第j个药效团之间的叠合体积,且对
Figure 778892DEST_PATH_IMAGE044
的求和仅限于同类药效团之间;
步骤(55),计算第一分子和第二分子的分子间综合叠合体积
Figure 2012102451073100001DEST_PATH_IMAGE046
,其中
Figure 2012102451073100001DEST_PATH_IMAGE048
为第一分子中的第i个药效团与第二个分子中的第j个药效团之间的叠合体积,且对
Figure 663671DEST_PATH_IMAGE048
的求和仅限于同类药效团之间;
步骤(56),计算第一分子和第二分子在多种叠合情况下的分子间综合叠合体积
Figure 2012102451073100001DEST_PATH_IMAGE050
作为分子间体积,选择其中的最大值
Figure 2012102451073100001DEST_PATH_IMAGE052
作为最大分子间体积;
所述步骤(33)具体包括:
计算第一分子和第二分子的相似度,以相似度
Figure 993022DEST_PATH_IMAGE034
作为两个分子形状的比较结果。
6. 根据权利要求3~5任一项所述的一种两个分子形状的比较方法,其特征在于,所述k的取值为0.5至1.0之间,所述
Figure 191922DEST_PATH_IMAGE022
的取值为0.5至1.0之间。
CN201210245107.3A 2012-07-16 2012-07-16 一种药物分子形状的比较方法 Active CN102799779B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201210245107.3A CN102799779B (zh) 2012-07-16 2012-07-16 一种药物分子形状的比较方法
EP12881232.8A EP2752784A4 (en) 2012-07-16 2012-11-16 MOLECULAR VOLUME CALCULATION METHOD AND METHOD FOR COMPARING FORMS OF TWO MOLECULES
JP2014545073A JP2015502611A (ja) 2012-07-16 2012-11-16 分子体積の計算方法及び2つの分子の形状の比較方法
US14/351,978 US9811642B2 (en) 2012-07-16 2012-11-16 Methods for shape comparison between drug molecules
PCT/CN2012/084713 WO2014012309A1 (zh) 2012-07-16 2012-11-16 一种分子体积计算方法及两分子的形状比较方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210245107.3A CN102799779B (zh) 2012-07-16 2012-07-16 一种药物分子形状的比较方法

Publications (2)

Publication Number Publication Date
CN102799779A true CN102799779A (zh) 2012-11-28
CN102799779B CN102799779B (zh) 2015-04-22

Family

ID=47198887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210245107.3A Active CN102799779B (zh) 2012-07-16 2012-07-16 一种药物分子形状的比较方法

Country Status (5)

Country Link
US (1) US9811642B2 (zh)
EP (1) EP2752784A4 (zh)
JP (1) JP2015502611A (zh)
CN (1) CN102799779B (zh)
WO (1) WO2014012309A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657146A (zh) * 2017-09-20 2018-02-02 广州市爱菩新医药科技有限公司 基于三维子结构的药物分子比较方法
CN108205613A (zh) * 2017-12-11 2018-06-26 华南理工大学 一种化合物分子间相似度的计算方法及系统与它们的应用
CN108875298A (zh) * 2018-06-07 2018-11-23 北京计算科学研究中心 基于分子形状匹配的药物筛选方法
CN109637673A (zh) * 2018-12-18 2019-04-16 广州市爱菩新医药科技有限公司 一种药物虚拟筛选方法
CN109637596A (zh) * 2018-12-18 2019-04-16 广州市爱菩新医药科技有限公司 一种药物靶点预测方法
CN109712677A (zh) * 2018-12-21 2019-05-03 广州市爱菩新医药科技有限公司 基于数据库的三维结构检索方法、电子设备及存储介质
CN113421610A (zh) * 2021-07-01 2021-09-21 北京望石智慧科技有限公司 一种分子叠合构象确定方法、装置以及存储介质
CN113593655A (zh) * 2021-08-10 2021-11-02 北京中大唯信科技有限公司 基于可变半径高斯球的分子体积计算方法以及用于药物虚拟筛选的分子三维相似度打分方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010101A (zh) * 2017-12-18 2018-05-08 重庆大学 一种绘制分子片段2d投影图的方法
CN116612825B (zh) * 2023-07-19 2023-10-13 四川省产品质量监督检验检测院 分子静电势等值面点云的碰撞点检测和碰撞体积计算方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1253545A2 (en) * 2001-04-26 2002-10-30 Nippon Zoki Pharmaceutical Co. Ltd. Method and program for evaluating molecular similarity
WO2003019140A2 (en) * 2001-08-23 2003-03-06 Deltagen Research Laboratories, L.L.C. Method for molecular subshape similarity matching

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030167159A1 (en) * 2001-10-04 2003-09-04 California Institute Of Technology Method for determining molecular surface areas and volumes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1253545A2 (en) * 2001-04-26 2002-10-30 Nippon Zoki Pharmaceutical Co. Ltd. Method and program for evaluating molecular similarity
WO2003019140A2 (en) * 2001-08-23 2003-03-06 Deltagen Research Laboratories, L.L.C. Method for molecular subshape similarity matching

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
尚志才等: "分子体积及表面积的Monte Carlo模拟计算", 《物理化学学报》 *
郭明等: "化合物分子体积计算方法的研究", 《浙江大学学报》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657146A (zh) * 2017-09-20 2018-02-02 广州市爱菩新医药科技有限公司 基于三维子结构的药物分子比较方法
CN107657146B (zh) * 2017-09-20 2020-05-05 广州市爱菩新医药科技有限公司 基于三维子结构的药物分子比较方法
CN108205613A (zh) * 2017-12-11 2018-06-26 华南理工大学 一种化合物分子间相似度的计算方法及系统与它们的应用
CN108875298A (zh) * 2018-06-07 2018-11-23 北京计算科学研究中心 基于分子形状匹配的药物筛选方法
CN108875298B (zh) * 2018-06-07 2019-06-07 北京计算科学研究中心 基于分子形状匹配的药物筛选方法
CN109637673A (zh) * 2018-12-18 2019-04-16 广州市爱菩新医药科技有限公司 一种药物虚拟筛选方法
CN109637596A (zh) * 2018-12-18 2019-04-16 广州市爱菩新医药科技有限公司 一种药物靶点预测方法
CN109712677A (zh) * 2018-12-21 2019-05-03 广州市爱菩新医药科技有限公司 基于数据库的三维结构检索方法、电子设备及存储介质
CN113421610A (zh) * 2021-07-01 2021-09-21 北京望石智慧科技有限公司 一种分子叠合构象确定方法、装置以及存储介质
CN113421610B (zh) * 2021-07-01 2023-10-20 北京望石智慧科技有限公司 一种分子叠合构象确定方法、装置以及存储介质
CN113593655A (zh) * 2021-08-10 2021-11-02 北京中大唯信科技有限公司 基于可变半径高斯球的分子体积计算方法以及用于药物虚拟筛选的分子三维相似度打分方法
CN113593655B (zh) * 2021-08-10 2024-03-26 北京中大唯信科技有限公司 用于药物虚拟筛选的分子三维相似度的打分方法

Also Published As

Publication number Publication date
WO2014012309A1 (zh) 2014-01-23
US9811642B2 (en) 2017-11-07
US20140278284A1 (en) 2014-09-18
EP2752784A1 (en) 2014-07-09
CN102799779B (zh) 2015-04-22
EP2752784A4 (en) 2015-06-10
JP2015502611A (ja) 2015-01-22

Similar Documents

Publication Publication Date Title
CN102799779B (zh) 一种药物分子形状的比较方法
Jiang et al. Drug–target affinity prediction using graph neural network and contact maps
Zhang et al. Free-energy calculations of ionic hydration consistent with the experimental hydration free energy of the proton
Wu et al. PRL‐dock: Protein‐ligand docking based on hydrogen bond matching and probabilistic relaxation labeling
CN105205348B (zh) 一种基于距离约束选择策略的群体构象空间优化方法
CN107209813A (zh) 用于分子结构的输入集合的相互作用参数
Wang et al. 3DSMILES-GPT: 3D molecular pocket-based generation with token-only large language model
Purohit et al. Structural basis for the resilience of Darunavir (TMC114) resistance major flap mutations of HIV-1 protease
Brylinski e matchsite: Sequence order-independent structure alignments of ligand binding pockets in protein models
Li The difficulty of protein structure alignment under the RMSD
Ugurlu et al. Cobdock: an accurate and practical machine learning-based consensus blind docking method
Weiser et al. Fast, approximate algorithm for detection of solvent‐inaccessible atoms
Gu et al. DBPP-Predictor: a novel strategy for prediction of chemical drug-likeness based on property profiles
Jiang et al. Structure-based prediction of nucleic acid binding residues by merging deep learning-and template-based approaches
Hosseini et al. Computational prediction of HIV-1 resistance to protease inhibitors
CN103077226A (zh) 一种多模态蛋白质构象空间搜索方法
Tong et al. Accurate optimization of amino acid form factors for computing small-angle X-ray scattering intensity of atomistic protein structures
Ma et al. An eigen-binding site based method for the analysis of anti-EGFR drug resistance in lung cancer treatment
Naden et al. Rapid computation of thermodynamic properties over multidimensional nonbonded parameter spaces using adaptive multistate reweighting
WO2023016621A1 (en) Ternary complex determination for plausible targeted protein degradation using deep learning and design of degrader molecules using deep learning
Maheshwari et al. Across-proteome modeling of dimer structures for the bottom-up assembly of protein-protein interaction networks
Tabrizi et al. Extending the solvation-layer interface condition continum electrostatic model to a linearized Poisson-Boltzmann solvent
Rasouli et al. Essential Considerations for Free Energy Calculations of RNA–Small Molecule Complexes: Lessons from the Theophylline-Binding RNA Aptamer
Li et al. Measuring the shapes of macromolecules–and why it matters
Gulyás-Kovács Integrated analysis of residue coevolution and protein structure in ABC transporters

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170914

Address after: 511458, Guangzhou, Guangdong province Nansha District City Ring Road, south 8, a self-made (production building) 408

Patentee after: Guangzhou city love new Pu Pharmaceutical Technology Co. Ltd.

Address before: 510632 Whampoa West Road, Guangdong, Guangzhou, No. 601, No.

Patentee before: Sun Yat-sen University

TR01 Transfer of patent right