[go: up one dir, main page]

CN117877611A - 一种预测分子性质的方法及装置 - Google Patents

一种预测分子性质的方法及装置 Download PDF

Info

Publication number
CN117877611A
CN117877611A CN202211220100.6A CN202211220100A CN117877611A CN 117877611 A CN117877611 A CN 117877611A CN 202211220100 A CN202211220100 A CN 202211220100A CN 117877611 A CN117877611 A CN 117877611A
Authority
CN
China
Prior art keywords
predicted
quantum
molecules
sub
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211220100.6A
Other languages
English (en)
Other versions
CN117877611B (zh
Inventor
请求不公布姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Benyuan Quantum Computing Technology Hefei Co ltd
Original Assignee
Benyuan Quantum Computing Technology Hefei Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Benyuan Quantum Computing Technology Hefei Co ltd filed Critical Benyuan Quantum Computing Technology Hefei Co ltd
Priority to CN202211220100.6A priority Critical patent/CN117877611B/zh
Publication of CN117877611A publication Critical patent/CN117877611A/zh
Application granted granted Critical
Publication of CN117877611B publication Critical patent/CN117877611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • G06N10/20Models of quantum computing, e.g. quantum circuits or universal quantum computers
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种预测分子性质的方法及装置,方法包括:首先获得待预测分子,并确定待预测分子的图数据,构建用于特征向量优化的目标量子线路,利用目标量子线路,将待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对高维特征向量进行特征融合,得到待预测分子的融合特征向量,将待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果,它通过量子线路实现分子性质的预测,利用量子的相关特性,提高计算速度和计算精确度。

Description

一种预测分子性质的方法及装置
技术领域
本发明属于量子计算技术领域,特别是一种预测分子性质的方法及装置。
背景技术
传统的药物分子性质预测方法主要依靠提取分子指纹或人为设计的特征,然后与机器学习算法结合使用。为了捕捉当前任务所需的特征,这类分子表征本身就带有领域专家的偏见。为了超越这种偏见,采用更通用的方法,不同类型的机器学习算法被引入到分子性质预测领域。由于计算能力的加快,大型数据集的可用性越来越高,以及在自然语言处理和模式识别等相关领域的巨大成功,深度学习算法被寄以厚望。这些不同类型的网络模型能够以自动化的方式学习特定任务的表征,因此可以消除复杂的特征提取过程。为了使用深度学习算法,规避特定领域的特征工程,需要为分子找到合适的表示方法,图神经网络方法应运而生。
利用经典图神经网络模型解决药物分子性质预测问题的难点在于特征提取和数据处理过程的复杂度高、训练过程中参数众多、预测准确度低等,而利用量子计算在计算能力方面具有巨大潜力,与经典计算机相比,信息处理量愈多,实施运算也愈加有利,也更能确保运算的精准性。现阶段,如何利用量子技术预测分子性质成为一个亟待解决的问题。
发明内容
本发明的目的是提供一种预测分子性质的方法及装置,以解决现有技术中的不足,它通过量子线路实现分子性质的预测,利用量子的相关特性,提高计算速度和计算精确度。
本申请的一个实施例提供了一种预测分子性质的方法,所述方法包括:
获得待预测分子,并确定所述待预测分子的图数据,所述图数据中包括待预测分子的节点特征向量和边特征向量;
构建用于特征向量优化的目标量子线路;
利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对所述高维特征向量进行特征融合,得到待预测分子的融合特征向量;
将所述待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果。
可选的,所述获得待预测分子,并确定所述待预测分子的图数据,包括:
获得待预测分子,将所述待预测分子的原子转换为图数据的节点,将所述待预测分子的化学键转换为图数据的边,以获得所述待预测分子的图数据。
可选的,所述构建用于特征向量优化的目标量子线路,包括:
获取一组量子比特并将所述量子比特的初态置为|0>;
利用第一类量子逻辑门,构建用于将所述待预测分子的图数据映射到所述量子比特叠加态的第一子量子线路;
利用第二类量子逻辑门,构建用于优化待预测分子的图数据的第二子量子线路;
构建用于提取优化后的待预测分子的图数据的特征向量的测量子线路;
利用所述第一子量子线路、所述第二子量子线路和所述测量子线路,获得用于特征向量优化的目标量子线路。
可选的,所述利用所述第一子量子线路、所述第二子量子线路和所述测量子线路,获得用于特征向量优化的目标量子线路,包括:
依次将所述第一子量子线路、所述第二子量子线路和所述测量子线路组合,得到目标量子线路,或
依次将所述第一子量子线路、预设数量个所述第二子量子线路和所述测量子线路组合,得到目标量子线路,其中,所述预设数量为大于等于2的整数。
可选的,所述第一类量子逻辑门包括:Hadamard量子逻辑门和量子旋转逻辑门;
所述第二类量子逻辑门包括:CNOT量子逻辑门和量子旋转逻辑门。
可选的,所述利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,包括:
运行并测量所述目标量子线路,获得所述目标量子线路的最终量子态;
将所述最终量子态转换为高维特征向量。
本申请的又一实施例提供了一种预测分子性质的装置,所述装置包括:
获得模块,用于获得待预测分子,并确定所述待预测分子的图数据,所述图数据中包括待预测分子的节点特征向量和边特征向量;
构建模块,用于构建用于特征向量优化的目标量子线路;
转换模块,用于利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对所述高维特征向量进行特征融合,得到待预测分子的融合特征向量;
得到模块,用于将所述待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果。
可选的,所述获得模块,包括:
获得单元,用于获得待预测分子,将所述待预测分子的原子转换为图数据的节点,将所述待预测分子的化学键转换为图数据的边,以获得所述待预测分子的图数据。
可选的,所述构建模块,包括:
获取单元,用于获取一组量子比特并将所述量子比特的初态置为|0>;
第一构建单元,用于利用第一类量子逻辑门,构建用于将所述待预测分子的图数据映射到所述量子比特叠加态的第一子量子线路;
第二构建单元,用于利用第二类量子逻辑门,构建用于优化待预测分子的图数据的第二子量子线路;
第三构建单元,用于构建用于提取优化后的待预测分子的图数据的特征向量的测量子线路;
组合单元,用于利用所述第一子量子线路、所述第二子量子线路和所述测量子线路,获得用于特征向量优化的目标量子线路。
可选的,所述组合单元,包括:
第一组合子单元,用于依次将所述第一子量子线路、所述第二子量子线路和所述测量子线路组合,得到目标量子线路,或
第二组合子单元,用于依次将所述第一子量子线路、预设数量个所述第二子量子线路和所述测量子线路组合,得到目标量子线路,其中,所述预设数量为大于等于2的整数。
可选的,所述转换模块,包括:
运行单元,用于运行并测量所述目标量子线路,获得所述目标量子线路的最终量子态;
转换单元,用于将所述最终量子态转换为高维特征向量。
本申请的又一实施例提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时实现上述任一项中所述的方法。
本申请的又一实施例提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述任一项中所述的方法。
与现有技术相比,本发明首先获得待预测分子,并确定待预测分子的图数据,构建用于特征向量优化的目标量子线路,利用目标量子线路,将待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对高维特征向量进行特征融合,得到待预测分子的融合特征向量,将待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果,它通过量子线路实现分子性质的预测,利用量子的相关特性,提高计算速度和计算精确度。
附图说明
图1是本发明实施例提供的一种预测分子性质的方法的计算机终端的硬件结构框图;
图2是本发明实施例提供的一种预测分子性质的方法的流程示意图;
图3是本发明实施例提供的一种目标量子线路示意图;
图4是本发明实施例提供的一种预测分子性质的装置的结构示意图。
具体实施方式
下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明实施例首先提供了一种预测分子性质的方法,该方法可以应用于电子设备,如计算机终端,具体如普通电脑、量子计算机等。
下面以运行在计算机终端上为例对其进行详细说明。图1为本发明实施例提供的一种预测分子性质的方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输装置106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的预测分子性质的方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
需要说明的是,真正的量子计算机是混合结构的,它包含两大部分:一部分是经典计算机,负责执行经典计算与控制;另一部分是量子设备,负责运行量子程序进而实现量子计算。而量子程序是由量子语言如QRunes语言编写的一串能够在量子计算机上运行的指令序列,实现了对量子逻辑门操作的支持,并最终实现量子计算。具体的说,量子程序就是一系列按照一定时序操作量子逻辑门的指令序列。
在实际应用中,因受限于量子设备硬件的发展,通常需要进行量子计算模拟以验证量子算法、量子应用等等。量子计算模拟即借助普通计算机的资源搭建的虚拟架构(即量子虚拟机)实现特定问题对应的量子程序的模拟运行的过程。通常,需要构建特定问题对应的量子程序。本发明实施例所指量子程序,即是经典语言编写的表征量子比特及其演化的程序,其中与量子计算相关的量子比特、量子逻辑门等等均有相应的经典代码表示。
量子线路作为量子程序的一种体现方式,也称量子逻辑电路,是最常用的通用量子计算模型,表示在抽象概念下对于量子比特进行操作的线路,其组成包括量子比特、线路(时间线),以及各种量子逻辑门,最后常需要通过量子测量操作将结果读取出来。
不同于传统电路是用金属线所连接以传递电压信号或电流信号,在量子线路中,线路可看成是由时间所连接,亦即量子比特的状态随着时间自然演化,在这过程中按照哈密顿运算符的指示,一直到遇上逻辑门而被操作。
一个量子程序整体上对应有一条总的量子线路,本发明所述量子程序即指该条总的量子线路,其中,该总的量子线路中的量子比特总数与量子程序的量子比特总数相同。可以理解为:一个量子程序可以由量子线路、针对量子线路中量子比特的测量操作、保存测量结果的寄存器及控制流节点(跳转指令)组成,一条量子线路可以包含几十上百个甚至千上万个量子逻辑门操作。量子程序的执行过程,就是对所有的量子逻辑门按照一定时序执行的过程。需要说明的是,时序即单个量子逻辑门被执行的时间顺序。
需要说明的是,经典计算中,最基本的单元是比特,而最基本的控制模式是逻辑门,可以通过逻辑门的组合来达到控制电路的目的。类似地,处理量子比特的方式就是量子逻辑门。使用量子逻辑门,能够使量子态发生演化,量子逻辑门是构成量子线路的基础,量子逻辑门包括单比特量子逻辑门,如Hadamard门(H门,哈德玛门)、泡利-X门(X门)、泡利-Y门(Y门)、泡利-Z门(Z门)、RX门、RY门、RZ门等等;多比特量子逻辑门,如CNOT门、CR门、iSWAP门、Toffoli门等等。量子逻辑门一般使用酉矩阵表示,而酉矩阵不仅是矩阵形式,也是一种操作和变换。一般量子逻辑门在量子态上的作用是通过酉矩阵左乘以量子态右矢对应的矩阵进行计算的。
本领域技术人员可以理解的是,在经典计算机中,信息的基本单元是比特,一个比特有0和1两种状态,最常见的物理实现方式是通过电平的高低来表示这两种状态。在量子计算中,信息的基本单元是量子比特,一个量子比特也有0和1两种状态,记为|0>和|1>,但它可以处于0和1两种状态的叠加态,可表示为其中,a、b为表示|0>态、|1>态振幅(概率幅)的复数,这是经典比特不具备的。测量后,量子比特的状态会塌缩至一个确定的状态(本征态,此处为|0>态、|1>态),其中,塌缩至|0>的概率是|a|2,塌缩至|1>的概率是|b|2,|a|2+|b|2=1,|>为狄拉克符号。
量子态,即指量子比特的状态,一般需要使用一组正交完备的基向量描述,其通常使用的计算基在量子算法(或称量子程序)中用二进制表示。例如,一组量子比特为q0、q1、q2,表示第0位、第1位、第2位量子比特,从高位到低位排序为q2q1q0,该组量子比特的量子态为23个计算基的叠加态,8个计算基是指:|000>、|001>、|010>、|011>、|100>、|101>、|110>、|111>,每个计算基与量子比特位对应一致,如|000>态,000从高位到低位对应q2q1q0。简言之,量子态是各基向量组成的叠加态,当其他基的概率幅为0时,即处于其中一个确定的基向量。
在量子力学中,所有的可测量的力学量都可以用一个厄密矩阵来描述,厄密矩阵的定义是,该矩阵的转置共轭即是该矩阵本身,即有:这样的矩阵通常称之为测量算符,非零算符都会有至少一个不为0的本征值λ以及与之对应的本征态|ψ>,满足H|ψ>=λ|ψ>,如果算符H的本征值对应的是某一个体系的能级分布,那么这样的算符也可以称其为哈密顿量(Hamiltonian)。
根据含时薛定谔方程,从一个态|ψ(t=0)>开始演化到另一个态|ψ(t=T)>是利用酉算符完成的,即U(0,T)|ψ(t=0)>=|ψ(t=T)>,其中,哈密顿量和酉算符的关系是,如果一个量子态在某个系统下自然演化,描述该系统的能量即哈密顿量,则酉算符可以由哈密顿量写出:
当系统从时间0开始,且哈密顿量不随时间变化时,酉算符即U=exp(-iHt)。在封闭系统的量子计算中,除测量外,所有的量子操作都可以用一个酉矩阵来描述,酉矩阵的定义是,该矩阵的转置共轭即是该矩阵的逆,即有:一般来说,酉算符在量子计算中也称之为量子逻辑门。
在量子-经典混合图神经模型(QGNN)中,用量子线路替换经典图神经网络中的图节点嵌入层,实现将分子图数据中的节点特征映射到高维希尔伯特空间中,并利用量子线路中数据并行计算的特点和量子纠缠的特性来提高特征提取和数据处理的效率。采用量子-经典混合算法可以减少训练参数量,降低模型复杂度。
例如可以首先将分子图数据的各个节点的特征编码到量子线路中,然后利用量子线路进行节点特征提取,将得到的具有新节点特征的图数据输入到经典图神经网络的卷积层和池化层进行图的表征提取,并以此表征为基础输出预测结果;然后利用回归损失函数计算输出结果的损失值,根据该值对模型参数进行优化,其中也包含了量子线路中参数的迭代优化;通过对量子-混合经典神经网络模型的不断迭代优化来提高分子预测准确度和稳定性。
参见图2,图2为本发明实施例提供的一种预测分子性质的方法的流程示意图,可以包括如下步骤:
S201:获得待预测分子,并确定所述待预测分子的图数据,所述图数据中包括待预测分子的节点特征向量和边特征向量。
具体的,待预测分子可以认为是用户想要获得分子性质结果的分子结构建模,例如包括组成该化学分子的原子类型、化学元素键、原子个数、原子坐标、电荷及自旋多重度等。
根据获得的待预测分子,将待预测分子的原子转换为图数据的节点,将待预测分子的化学键转换为图数据的边,以获得待预测分子的图数据。其中,节点特征向量是表征节点(即实体对象)属性的向量,属性是描述图神经网络节点的特征。图神经网络是一种直接作用于图上的神经网络,图数据是由节点和边组成的一种数据结构,其中,节点是指实体对象,边是指节点之间的关系。图神经网络中每一个节点基于信息传播机制,通过相互交换信息来更新本节点的状态。在一些实施例中,图神经网络模型可以基于当前每个节点的状态,获取节点的预测结果。
S202:构建用于特征向量优化的目标量子线路。
具体的,构建用于特征向量优化的目标量子线路,可以包括:
1.获取一组量子比特并将所述量子比特的初态置为|0>;
2.利用第一类量子逻辑门,构建用于将所述待预测分子的图数据映射到所述量子比特叠加态的第一子量子线路;
3.利用第二类量子逻辑门,构建用于优化待预测分子的图数据的第二子量子线路;
4.构建用于提取优化后的待预测分子的图数据的特征向量的测量子线路;
5.利用所述第一子量子线路、所述第二子量子线路和所述测量子线路,获得用于特征向量优化的目标量子线路。
需要说明的是,所述第一类量子逻辑门包括:Hadamard量子逻辑门(H门)和量子旋转逻辑门;所述第二类量子逻辑门包括:CNOT量子逻辑门和量子旋转逻辑门。
其中,利用第一子量子线路、第二子量子线路和测量子线路,获得用于特征向量优化的目标量子线路,可以包括:
依次将所述第一子量子线路、所述第二子量子线路和所述测量子线路组合,得到目标量子线路,或依次将所述第一子量子线路、预设数量个所述第二子量子线路和所述测量子线路组合,得到目标量子线路,其中,所述预设数量为大于等于2的整数。
示例性的,参见图3,图3为本发明实施例提供的一种目标量子线路示意图,其中,获取9个量子比特并将所有量子比特的初态置为|0>,分别为量子比特q[0]-q[8],在第一子量子线路中(图3实线框部分)主要使用了H门和RY门,首先使用H门作用于量子比特的初态上,使其转化为叠加态/>然后将经典的图节点数据xi=[a0、a0、…、a7、a8]作为量子门参数,形式为RY(aj),其中j=0,1,…,7,8,分别量子化映射到叠加态的量子位上。在一层第二子量子线路(图3虚线框部分)中使用了两种量子门操作:CNOT门和RY门。CNOT门的主要作用是实现量子纠缠,它可以使量子比特之间的信息进行交换与传递。在实现了多次跨量子位的纠缠后,线路中又引入了参数化的RY(θ)门,通过不断迭代优化旋转角参数θ可以实现对目标量子线路的优化从而学习到更有效的节点特征编码,而且可以根据线路结构和任务需要多次叠加此层,增加深度,以寻求更优线路模型。测量输出层是目标量子线路的最后一层,作用是使量子比特的退相干,实现量子数据到经典数据的转化。
S203:利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对所述高维特征向量进行特征融合,得到待预测分子的融合特征向量。
具体的,利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,可以包括:
运行并测量所述目标量子线路,获得所述目标量子线路的最终量子态;将所述最终量子态转换为高维特征向量。
示例性的,利用目标量子线路,首先,输入待预测分子的图数据的各个节点通过目标量子线路(量子变分线路VQC)进行特征编码得到节点特征编码向量/>其中,n为单个节点特征数,例如,可以令n=9,然后将得到的特征向量融合生成节点编码特征矩阵/>以水分子H2O为例,该分子中含有3个原子节点和2条边(化学键),可以通过smiles2graph库将该分子数据转化为含有边特征向量E和节点特征向量/>的图数据。图数据中的各个原子节点特征向量分别经过VQC的特征编码,输出新的节点特征编码向量/>然后将其拼接成新的节点特征。接上述如图3所示的示例,在编码过程中,由于该模型中单节点特征数n=9,所以量子线路是由9个量子比特组成,且用各个量子比特的泡利Z的测量期望值作为输出,所以输出的各节点的特征编码x′i为一个9维向量。
S204:将所述待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果。
具体的,在得到待预测分子的融合特征向量之后,可以将待预测分子的融合特征向量输入到预先训练好的分子性质预测模型中,以得到待预测分子性质的预测结果。其中,分子性质预测模型可以通过神经网络等机器学习模型训练得到,本实施例在此不做具体限定。
示例性的,分子性质的预测可以包括:待预测分子特征抽取,构建特征向量和邻接矩阵,将分子图像转化为具有原子信息、化学键信息以及分子结构信息的数字化向量,构建图像卷积层,将得到的特征向量和图像邻接矩阵输入,获取卷积后的特征向量;构建池化层,对分子的特征向量进行池化,提取分子特征向量。例如,可以将各节点编码后的特征向量x′i拼接到一起构成了节点特征矩阵邻接矩阵A表示了各个节点与其周围节点的连接情况,它与节点特征矩阵X一同作为图卷积层的输入。图卷积层通过特征矩阵X和邻接矩阵A对节点和边的信息进行聚和、传递,最终实现节点的表征学习。该模型的图卷积神经网络由L个图卷积层组成,每一层都通过聚合邻接节点的上一层的表征来生成中心节点的当前层的表征:
Zl+1=A′XlWl,Xl+1=σ(Zl+1)
其中,表示第l层N个节点的表征,并且有X0=X,A′是A归一化和规范化后的邻接矩阵,/>是权重矩阵,也就是要训练的参数。为了简单起见,可以假设所有层的表征维度都是一样的,即F1=…=FL=F。激活函数σ通常可以根据用户需要进行设定。
最后,在通过多层图卷积操作后得到节点表征后,需要对图上各个节点的表征做图池化(Graph Pooling),或称为图读出(Graph Readout),得到一个图表征节点最后基于图的表征g,通过全连接神经网络层输出预测值/>
对于损失的计算,可以根据任务类型选择不同的损失函数,如果是分类任务可以选择交叉熵损失函数H(p,q),其计算公式如下:
其中,概率分布p(x)为期望输出,即数据集的标签,概率分布为实际输出,即模型根据输入数据所生成的概率值。交叉熵损失越小实际输出的概率分布q(x)与期望输出的概率分布p(x)越接近。
而对于回归任务可以选择均方方差损失函数Loss,其计算公式如下:
其中,yi为数据标签值,fθ(xi)为模型输出值。两个值越接近损失值越小,模型性能也越好。对于模型参数的优化,可以选择学习率为0.001的Adam梯度更新算法。
可见,本发明首先获得待预测分子,并确定待预测分子的图数据,构建用于特征向量优化的目标量子线路,利用目标量子线路,将待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对高维特征向量进行特征融合,得到待预测分子的融合特征向量,将待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果,它通过量子线路实现分子性质的预测,利用量子的相关特性,提高计算速度和计算精确度。
参见图4,图4为本发明实施例提供的一种预测分子性质的装置的结构示意图,与图2所示的流程相对应,可以包括:
获得模块401,用于获得待预测分子,并确定所述待预测分子的图数据,所述图数据中包括待预测分子的节点特征向量和边特征向量;
构建模块402,用于构建用于特征向量优化的目标量子线路;
转换模块403,用于利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对所述高维特征向量进行特征融合,得到待预测分子的融合特征向量;
得到模块404,用于将所述待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果。
具体的,所述获得模块,包括:
获得单元,用于获得待预测分子,将所述待预测分子的原子转换为图数据的节点,将所述待预测分子的化学键转换为图数据的边,以获得所述待预测分子的图数据。
具体的,所述构建模块,包括:
获取单元,用于获取一组量子比特并将所述量子比特的初态置为|0>;
第一构建单元,用于利用第一类量子逻辑门,构建用于将所述待预测分子的图数据映射到所述量子比特叠加态的第一子量子线路;
第二构建单元,用于利用第二类量子逻辑门,构建用于优化待预测分子的图数据的第二子量子线路;
第三构建单元,用于构建用于提取优化后的待预测分子的图数据的特征向量的测量子线路;
组合单元,用于利用所述第一子量子线路、所述第二子量子线路和所述测量子线路,获得用于特征向量优化的目标量子线路。
具体的,所述组合单元,包括:
第一组合子单元,用于依次将所述第一子量子线路、所述第二子量子线路和所述测量子线路组合,得到目标量子线路,或
第二组合子单元,用于依次将所述第一子量子线路、预设数量个所述第二子量子线路和所述测量子线路组合,得到目标量子线路,其中,所述预设数量为大于等于2的整数。
具体的,所述转换模块,包括:
运行单元,用于运行并测量所述目标量子线路,获得所述目标量子线路的最终量子态;
转换单元,用于将所述最终量子态转换为高维特征向量。
与现有技术相比,本发明首先获得待预测分子,并确定待预测分子的图数据,构建用于特征向量优化的目标量子线路,利用目标量子线路,将待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对高维特征向量进行特征融合,得到待预测分子的融合特征向量,将待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果,它通过量子线路实现分子性质的预测,利用量子的相关特性,提高计算速度和计算精确度。
本发明实施例还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时实现上述任一项中方法实施例中的步骤。
具体的,在本实施例中,上述存储介质可以被设置为存储用于实现以下步骤的计算机程序:
S201:获得待预测分子,并确定所述待预测分子的图数据,所述图数据中包括待预测分子的节点特征向量和边特征向量;
S202:构建用于特征向量优化的目标量子线路;
S203:利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对所述高维特征向量进行特征融合,得到待预测分子的融合特征向量;
S204:将所述待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果。
具体的,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明实施例还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述任一项中方法实施例中的步骤。
具体的,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
具体的,在本实施例中,上述处理器可以被设置为通过计算机程序实现以下步骤:
S201:获得待预测分子,并确定所述待预测分子的图数据,所述图数据中包括待预测分子的节点特征向量和边特征向量;
S202:构建用于特征向量优化的目标量子线路;
S203:利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对所述高维特征向量进行特征融合,得到待预测分子的融合特征向量;
S204:将所述待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果。
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,以上所述仅为本发明的较佳实施例,但本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。

Claims (10)

1.一种预测分子性质的方法,其特征在于,所述方法包括:
获得待预测分子,并确定所述待预测分子的图数据,所述图数据中包括待预测分子的节点特征向量和边特征向量;
构建用于特征向量优化的目标量子线路;
利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对所述高维特征向量进行特征融合,得到待预测分子的融合特征向量;
将所述待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述获得待预测分子,并确定所述待预测分子的图数据,包括:
获得待预测分子,将所述待预测分子的原子转换为图数据的节点,将所述待预测分子的化学键转换为图数据的边,以获得所述待预测分子的图数据。
3.根据权利要求1所述的方法,其特征在于,所述构建用于特征向量优化的目标量子线路,包括:
获取一组量子比特并将所述量子比特的初态置为|0>;
利用第一类量子逻辑门,构建用于将所述待预测分子的图数据映射到所述量子比特叠加态的第一子量子线路;
利用第二类量子逻辑门,构建用于优化待预测分子的图数据的第二子量子线路;
构建用于提取优化后的待预测分子的图数据的特征向量的测量子线路;
利用所述第一子量子线路、所述第二子量子线路和所述测量子线路,获得用于特征向量优化的目标量子线路。
4.根据权利要求3所述的方法,其特征在于,所述利用所述第一子量子线路、所述第二子量子线路和所述测量子线路,获得用于特征向量优化的目标量子线路,包括:
依次将所述第一子量子线路、所述第二子量子线路和所述测量子线路组合,得到目标量子线路,或
依次将所述第一子量子线路、预设数量个所述第二子量子线路和所述测量子线路组合,得到目标量子线路,其中,所述预设数量为大于等于2的整数。
5.根据权利要求3或4所述的方法,其特征在于,所述第一类量子逻辑门包括:Hadamard量子逻辑门和量子旋转逻辑门;
所述第二类量子逻辑门包括:CNOT量子逻辑门和量子旋转逻辑门。
6.根据权利要求3至5任一项所述的方法,其特征在于,所述利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,包括:
运行并测量所述目标量子线路,获得所述目标量子线路的最终量子态;
将所述最终量子态转换为高维特征向量。
7.一种预测分子性质的装置,其特征在于,所述装置包括:
获得模块,用于获得待预测分子,并确定所述待预测分子的图数据,所述图数据中包括待预测分子的节点特征向量和边特征向量;
构建模块,用于构建用于特征向量优化的目标量子线路;
转换模块,用于利用所述目标量子线路,将所述待预测分子的节点特征向量和边特征向量转换为高维特征向量,并对所述高维特征向量进行特征融合,得到待预测分子的融合特征向量;
得到模块,用于将所述待预测分子的融合特征向量输入到训练好的分子性质预测模型中,得到待预测分子性质的预测结果。
8.根据权利要求7所述的装置,其特征在于,所述获得模块,包括:
获得单元,用于获得待预测分子,将所述待预测分子的原子转换为图数据的节点,将所述待预测分子的化学键转换为图数据的边,以获得所述待预测分子的图数据。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时实现所述权利要求1至6任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现所述权利要求1至6任一项中所述的方法。
CN202211220100.6A 2022-09-30 2022-09-30 一种预测分子性质的方法及装置 Active CN117877611B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211220100.6A CN117877611B (zh) 2022-09-30 2022-09-30 一种预测分子性质的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211220100.6A CN117877611B (zh) 2022-09-30 2022-09-30 一种预测分子性质的方法及装置

Publications (2)

Publication Number Publication Date
CN117877611A true CN117877611A (zh) 2024-04-12
CN117877611B CN117877611B (zh) 2025-08-08

Family

ID=90575963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211220100.6A Active CN117877611B (zh) 2022-09-30 2022-09-30 一种预测分子性质的方法及装置

Country Status (1)

Country Link
CN (1) CN117877611B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119479840A (zh) * 2024-06-19 2025-02-18 本源量子计算科技(合肥)股份有限公司 药物分子性质预测方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111710375A (zh) * 2020-05-13 2020-09-25 中国科学院计算机网络信息中心 一种分子性质预测方法及系统
CN113159239A (zh) * 2021-06-28 2021-07-23 北京航空航天大学 一种量子图卷积神经网络处理图数据的方法
CN113544786A (zh) * 2019-02-08 2021-10-22 谷歌有限责任公司 使用机器学习预测分子嗅觉特性的系统和方法
CN114550849A (zh) * 2022-02-25 2022-05-27 上海图灵智算量子科技有限公司 基于量子图神经网络解决化学分子性质预测的方法
CN114974405A (zh) * 2022-05-07 2022-08-30 上海图灵智算量子科技有限公司 基于量子gnn的结合能预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113544786A (zh) * 2019-02-08 2021-10-22 谷歌有限责任公司 使用机器学习预测分子嗅觉特性的系统和方法
CN111710375A (zh) * 2020-05-13 2020-09-25 中国科学院计算机网络信息中心 一种分子性质预测方法及系统
CN113159239A (zh) * 2021-06-28 2021-07-23 北京航空航天大学 一种量子图卷积神经网络处理图数据的方法
CN114550849A (zh) * 2022-02-25 2022-05-27 上海图灵智算量子科技有限公司 基于量子图神经网络解决化学分子性质预测的方法
CN114974405A (zh) * 2022-05-07 2022-08-30 上海图灵智算量子科技有限公司 基于量子gnn的结合能预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119479840A (zh) * 2024-06-19 2025-02-18 本源量子计算科技(合肥)股份有限公司 药物分子性质预测方法及相关装置

Also Published As

Publication number Publication date
CN117877611B (zh) 2025-08-08

Similar Documents

Publication Publication Date Title
CN114792378B (zh) 一种量子图像识别方法及装置
CN116011682B (zh) 一种气象数据预测方法、装置、存储介质及电子装置
CN114821217B (zh) 一种基于量子经典混合神经网络的图像识别方法及装置
CN113222150B (zh) 一种量子态的变换方法及装置
CN116431807B (zh) 一种文本分类方法、装置、存储介质及电子装置
CN116400430B (zh) 一种气象数据预测方法、装置、存储介质及电子装置
CN115759413B (zh) 一种气象预测方法、装置、存储介质及电子设备
CN114358319A (zh) 基于机器学习框架的分类方法及相关装置
CN116187548A (zh) 一种光伏发电功率预测方法、装置、存储介质及电子装置
CN117852660A (zh) 一种变分量子线路的构造方法、装置、介质及电子装置
CN118863078B (zh) 一种变分量子线路的构造方法、装置、介质及电子装置
CN114764619B (zh) 一种基于量子线路的卷积操作方法及装置
CN116499466B (zh) 一种智能体导航方法、装置、存储介质及电子装置
CN117875370A (zh) 一种利用分子数据的任务处理方法及装置
CN117877611B (zh) 一种预测分子性质的方法及装置
CN116011681A (zh) 一种气象数据预测方法、装置、存储介质及电子装置
CN117709415A (zh) 一种量子神经网络模型的优化方法及装置
CN116403657A (zh) 一种药物反应预测方法、装置、存储介质及电子装置
CN114511094B (zh) 一种量子算法的优化方法、装置、存储介质与电子装置
CN116484731A (zh) 一种复杂系统的预测方法、装置、存储介质及电子装置
CN113222151B (zh) 一种量子态的变换方法及装置
CN116306952B (zh) 一种分子性质预测方法、装置、存储介质及电子装置
CN116070707A (zh) 基于量子线路的线性系统求解方法、装置、介质及设备
CN114819167A (zh) 一种稀疏线性系统的稀疏近似逆量子预处理方法及装置
CN116167407B (zh) 一种基于量子循环神经网络的数据预测方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 230088 Anhui Province, Hefei City, Gaoxin District, Chengxiqiao Community Service Center, No. 900 Wangjiang West Road, Zhong'an Chuanggu Science and Technology Park Phase I, Building D8

Patentee after: Benyuan Quantum Computing Technology (Hefei) Co.,Ltd.

Country or region after: China

Address before: 230088 6th floor, E2 building, phase II, innovation industrial park, 2800 innovation Avenue, high tech Zone, Hefei City, Anhui Province

Patentee before: Benyuan Quantum Computing Technology (Hefei) Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address