WO2019141186A1

WO2019141186A1 - 数据处理方法和装置

Info

Publication number: WO2019141186A1
Application number: PCT/CN2019/071963
Authority: WO
Inventors: 格罗斯曼罗宾; 薛询; 陈亨利; 马文斌
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2018-01-16
Filing date: 2019-01-16
Publication date: 2019-07-25
Anticipated expiration: 2020-07-16
Also published as: CN110045912B; US11604597B2; US20200348851A1; EP3726365B1; EP3726365A4; EP3726365A1; CN110045912A

Abstract

一种数据处理方法和装置，该方法包括：存储主节点接收读写节点发送的第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作；所述存储主节点根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务；当所述第一事务结束时，所述存储主节点生成第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息；所述存储主节点向至少一个只读节点发送所述第一事务状态元数据。所述数据处理方法和装置，有利于一定程度上消除只读节点的读延迟。

Description

数据处理方法和装置

本申请要求于2018年1月16日提交中国专利局、申请号为201810041076.7、申请名称为“数据处理方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信领域，特别涉及通信领域中的数据处理方法和装置。

背景技术

在数据读写压力大的核心业务系统中，单一的数据库读写节点业务压力大，数据读写操作响应慢。这些核心业务系统普遍采用读写分离架构的分布式数据库，以扩展数据库系统的只读能力。读写分离架构数据库将对数据的只读操作分流到数据库只读节点，以减轻数据库读写节点的业务压力。具体地，主节点作为读写节点，对存储节点中的数据执行的写操作，即修改的数据的信息，可以通过日志同步到备节点上，备节点作为只读节点，通过重放，实现数据更新，并提供数据的只读服务。

但是，读写节点和只读节点之间通过日志的复制实现数据同步会产生读延迟的问题。这是因为读写节点请求更新的数据，要经过秒级到分钟级的延迟才能被只读节点感知，例如，存储节点在按照读写节点的请求执行了数据的更新之后，会周期性地将修改数据的信息发送给只读节点进行备份，以便该只读节点根据上述信息获取最新版本的数据。这个周期可能是30s、1min等固定的时间段，这就会导致客户端通过只读节点读取的数据都是秒级到分钟级之前的旧数据。由于只读节点的读延迟的存在，对数据延迟高度敏感的业务无法通过只读节点实现数据的只读操作。

发明内容

本申请提供一种数据处理方法和装置，有利于一定程度上消除只读节点的读延迟。

第一方面，提供了一种数据处理方法，包括：存储主节点接收读写节点发送的第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作；所述存储主节点根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务；当所述第一事务结束时，所述存储主节点根据所述第一数据的当前状态，生成第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息；所述存储主节点向至少一个只读节点发送所述第一事务状态元数据。

应理解，事务结束指一个事务提交(commit)、中断(interrupt)或者回滚(rollback)，其中，提交指事务执行成功，回滚指恢复成事务开始执行前的状态，中断指事务中途停止执行。存储主节点在进行解析的时候，会判断第一事务是否结束，当该第一事务结束时，存储主节点可以生成包括已失效的数据的标识信息和该第一事务的标识信息的第一事务状态元数据，具体可以为已失效页面的标识ID和第一事务的标识ID，但本申请实施例对此不作限定。

可选地，该第一事务状态元数据可以包括被回放日志redo log操作修改后应该在缓存中失效的数据页面列表、已提交的事务列表、现有执行中的事务下可见的LSN等信息。

在本申请实施例中，一旦第一事务状态元数据被生成，该存储主节点便会向至少一个只读节点发送该第一事务状态元数据，使得该至少一个只读节点根据该第一事务状态元数据，对本地事务状态元数据进行更新。

本申请实施例的数据处理方法，通过存储主节点在事务结束时主动将事务状态元数据推送给只读节点，使得只读节点能够获取到最新的事务状态，保证在读写节点和只读节点上只读操作获取的数据页面的内容一致，有利于消除只读节点的读延迟，从而提高用户体验。

结合第一方面，在第一方面的某些实现方式中，在所述存储主节点根据所述第一数据的当前状态，生成第一事务状态元数据之后，所述方法还包括：所述存储主节点向所述读写节点发送响应消息，所述响应消息用于表示所述第一事务的执行结果。

具体地，存储主节点还可以向读写节点发送响应消息，进行网络通信的响应，告知读写节点第一事务的执行结果。应理解，一个事务的执行结果具体可以包括该事务的提交、中断或者回滚，本申请实施例对此不作限定。可选地，读写节点接收该响应消息，在获知第一事务提交后，可以从日志记录里把对应的redo log删除。

结合第一方面，在第一方面的某些实现方式中，所述第一事务的信息包括至少一个日志，所述至少一个日志中的第一日志携带第一标识，所述第一标识用于标识所述第一事务结束，且所述第一日志的日志序列号为所述至少一个日志中日志序列号的最大值。

应理解，第一事务包括至少一个日志，每个日志中会包括日志序列号，存储主节点是根据日志序列号、按顺序执行第一事务的这些日志的，携带结束标志是为了便于存储主节点快速识别事务已结束。例如，第一事务可以包括3条日志，按照执行顺序为a＝1，b＝1以及end类型日志，存储主节点按顺序执行a＝1，b＝1以及end类型日志，在碰到end类型日志时便知道第一事务已经结束了，无需继续再对第一事务进行处理。

由于存储主节点是按照LSN的顺序进行处理的，所以标志事务结束的日志肯定是LSN最大的那个。当执行到该标志事务结束的日志时，其他日志必然已经提交了。

在本申请实施例中，存储主节点可以通过第一标识快速识别一个事务的结束，从而触发事务状态元数据的生成，从而进一步消除只读节点的读延迟，提高系统性能。应理解，存储主节点在根据redo log构建某个版本的数据页面时，如果碰到第一标识(例如，end类型)的redo log可直接忽略，即不对数据做任何处理。这是由于携带第一标识的redo log仅仅用于表示事务结束，并无其他额外的含义，即这一类型的redo log不会请求对数据做任何修改。

结合第一方面，在第一方面的某些实现方式中，所述存储主节点根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务，包括：所述存储主节点对所述至少一个日志进行解析；所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点。

具体地，存储主节点可以对第一事务所包括的至少一个日志进行解析，并且，在存储备节点存在的情况下，存储主节点可以通过复制协议(例如，大多数复制协议)把该至少一个日志(例如，redo log)存储在大多数存储备节点的日志存储库内。

结合第一方面，在第一方面的某些实现方式中，所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点，包括：在所述存储主节点对所述至少一个日志进行解析的同时，所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点。

具体地，存储主节点对至少一个日志的解析和复制这两个步骤可以是并行执行的，即该存储主节点在对至少一个日志进行解析的同时，将至少一个日志按照复制协议复制到至少一个存储备节点。

在本申请实施例中，通过并行执行至少一个日志在不同存储节点间的复制和该至少一个日志在存储主节点上的解析，提高了第一事务状态元数据的生成速度，防止因事务状态信息更新缓慢而影响第一事务的提交速度，有利于提高读写节点的请求吞吐率。

结合第一方面，在第一方面的某些实现方式中，在所述存储主节点根据所述第一数据的当前状态，生成第一事务状态元数据之后，所述方法还包括：所述存储主节点向所述读写节点发送所述第一事务状态元数据。

具体地，存储主节点在生成第一事务状态元数据之后，还可以将其发送给读写节点，即读写节点还可以包括全局事务状态元数据模块，用于存储事务状态元数据，该事务状态元数据可以是该读写节点自己生成的，也可以是该存储主节点发送给该读写节点的，本申请实施例对此不作限定。

应理解，存储全局事务状态元数据的模块位于读写节点上的好处是，读写节点一般是由一个外部的管理器或者管理员指定的，每个只读节点有明确的管理配置信息从哪个节点可以获取到读写节点上的事务状态元数据信息。而由于存储节点间通过一致性复制协议备份数据，存储主节点与存储备节点的角色可能在运行时发生变更，即某个存储主节点变为存储备节点，而某个存储主节点转变为存储备节点。若存储全局事务状态元数据的模块位于存储主节点，只读节点需要额外的机制识别哪个存储节点是存储主节点，从而获取事务状态元数据信息。因此，本申请实施例的方法便于管理，能够提高系统的灵活性。

在本申请的其他方面，提供了另一种数据处理方法，包括：存储主节点接收只读节点发送的第一请求消息，所述第一请求消息用于请求更新本地事务状态元数据，所述本地事务状态元数据包括已失效的数据的标识信息和已提交的事务的标识信息；所述存储主节点向所述只读节点发送所述第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和第一事务的标识信息，所述第一事务为已提交的事务。

第二方面，提供了另一种数据处理方法，包括：读写节点向存储主节点发送第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作；所述读写节点接收所述存储主节点发送的响应消息，所述响应消息用于表示所述第一事务的执行结果；当所述读写节点接收到所述响应消息时，所述读写节点向至少一个只读节点发送第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息。

本申请实施例的数据处理方法，通过读写节点在接收到事务的执行结果的响应时主动将事务状态元数据推送给只读节点，使得只读节点能够获取到最新的事务状态，保证在读写节点和只读节点上只读操作获取的数据页面的内容一致，有利于消除只读节点的读延迟，从而提高用户体验。

结合第二方面，在第二方面的某些实现方式中，在所述读写节点向至少一个只读节点发送第一事务状态元数据之前，所述方法还包括：所述读写节点接收所述存储主节点发送的所述第一事务状态元数据，或当所述第一事务结束时，所述读写节点生成所述第一事务状态元数据。

结合第二方面，在第二方面的某些实现方式中，所述第一事务的信息包括至少一个日志，所述至少一个日志中的第一日志携带第一标识，所述第一标识用于标识所述第一事务结束，且所述第一日志的日志序列号为所述至少一个日志中日志序列号的最大值。

在本申请的其他方面，提供了另一种数据处理方法，包括：读写节点接收只读节点发送的第一请求消息，所述第一请求消息用于请求更新本地事务状态元数据，所述本地事务状态元数据包括已失效的数据的标识信息和已提交的事务的标识信息；所述读写节点向所述只读节点发送所述第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和第一事务的标识信息，所述第一事务为已提交的事务。

第三方面，提供了另一种数据处理方法，包括：只读节点接收第一客户端发送的第二请求消息，所述第二请求消息用于请求对至少一个存储节点中存储的第二数据执行只读操作，所述至少一个存储节点包括存储主节点；所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，所述第一请求消息用于请求更新本地事务状态元数据，所述本地事务状态元数据包括已失效的数据的标识信息和已提交的事务的标识信息；所述只读节点接收所述存储主节点或所述读写节点根据所述第一请求消息发送的第一事务状态元数据，并对所述本地事务状态元数据进行更新；所述只读节点根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据。

本申请实施例的数据处理方法，通过只读节点在执行只读操作之前，向存储事务状态元数据的存储主节点或只读节点发送更新请求，存储主节点或只读节点在接收到该更新请求之后才向只读节点发送最新的事务状态元数据，使得只读节点能够在执行只读操作前获取到最新的事务状态，保证在读写节点和只读节点上只读操作获取的数据页面的内容一致，有利于消除只读节点的读延迟，从而提高用户体验。

结合第三方面，在第三方面的某些实现方式中，所述只读节点根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据，包括：所述只读节点根据更新后的所述本地事务状态元数据，确定第二标识，所述第二标识对应所述第二数据的最新版本；所述只读节点向所述至少一个存储节点发送第三请求消息，所述第三请求消息用于请求读取所述第二标识对应的所述第二数据；所述只读节点接收所述至少一个存储节点发送的所述第二标识对应的所述第二数据。

结合第三方面，在第三方面的某些实现方式中，在所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息之前，所述方法还包括：所述只读节点缓存所述第二请求消息，并开启定时器；所述只读节点接收第二客户端发送的至少一个第四请求消息，所述至少一个第四请求消息用于请求对所述至少一个存储节点中存储的第三数据执行只读操作；所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，包括：当所述只读节点中缓存的消息的数量超过第一阈值，或者所述定时器超时，所述只读节点向所述存储主节点或所述读写节点发送所述第一请求消息。

具体地，只读节点可以阻塞发起更新事务状态元数据的请求，直到收到的请求消息符合一定条件后，再批量发起请求。该只读节点可以在接收到第一客户端发送的第二请求消息之后，缓存该第二请求消息，并开启定时器。接着，该只读节点可以接收其他客户端发送的其他请求消息，用于请求对其他数据执行只读操作，例如，第二客户端发送的至少一个第四请求消息，用于请求对第三数据执行只读操作。该只读节点可以实时判断缓存队列中的消息数量是否超过第一阈值，或定时器是否超时，若缓存队列中的消息数量超过第一阈值，或定时器超时，该只读节点向存储主节点或读写节点发送第一请求消息，请求更新本地事务状态元数据。

在本申请实施例中，通过只读节点在一定时间内阻塞单个只读事务，对多个只读事务批量地从存储节点获取事务状态元数据，防止了每个只读事务对存储节点上的事务状态元数据的重复获取，避免了对每个只读事务进行一次事务状态元数据获取所带来的高网络负载，提升了获取事务状态元数据的吞吐率。

第四方面，提供了一种数据处理装置，用于执行第一方面或第一方面任意可能的实现方式中的方法。具体地，该终端设备包括用于执行上述第一方面或第一方面的任一种可能的实现方式中的方法的单元。

第五方面，提供了另一种数据处理装置，用于执行第二方面或第二方面任意可能的实现方式中的方法。具体地，该网络设备包括用于执行上述第二方面或第二方面的任一种可能的实现方式中的方法的单元。

第六方面，提供了另一种数据处理装置，用于执行第二方面或第二方面任意可能的实现方式中的方法。具体地，该网络设备包括用于执行上述第三方面或第三方面的任一种可能的实现方式中的方法的单元。

第七方面，提供了另一种数据处理装置，该装置包括：至少一个处理器、存储器和通信接口。其中，该至少一个处理器、该存储器和该通信接口均通过内部通路连接，该存储器用于存储计算机执行指令，该至少一个处理器用于执行该存储器存储的计算机执行指令，使得该装置可以通过该通信接口与其它装置进行数据交互来执行第一方面或第一方面的任意可能的实现方式中的方法。

第八方面，提供了另一种数据处理装置，该装置包括：至少一个处理器、存储器和通信接口。其中，该至少一个处理器、该存储器和该通信接口均通过内部通路连接，该存储器用于存储计算机执行指令，该至少一个处理器用于执行该存储器存储的计算机执行指令，使得该装置可以通过该通信接口与其它装置进行数据交互来执行第二方面或第二方面的任意可能的实现方式中的方法。

第九方面，提供了另一种数据处理装置，该装置包括：至少一个处理器、存储器和通信接口。其中，该至少一个处理器、该存储器和该通信接口均通过内部通路连接，该存储器用于存储计算机执行指令，该至少一个处理器用于执行该存储器存储的计算机执行指令，使得该装置可以通过该通信接口与其它装置进行数据交互来执行第三方面或第三方面的任意可能的实现方式中的方法。

第十方面，提供了一种数据处理系统，该系统包括上述第四方面或第四方面的任一种可能实现方式中的装置、第五方面或第五方面的任一种可能实现方式中的装置以及第六方面或第六方面中的任一种可能实现方式中的装置；或者

该系统包括上述第七方面或第七方面的任一种可能实现方式中的装置、第八方面或第八方面的任一种可能实现方式中的装置以及第九方面或第九方面中的任一种可能实现方式中的装置。

第十一方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序代码，当所述计算机程序代码被计算机运行时，使得所述计算机执行上述第一方面或第一方面任一种可能实现方式中的方法。

第十二方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序代码，当所述计算机程序代码被计算机运行时，使得所述计算机执行上述第二方面或第二方面任一种可能实现方式中的方法。

第十三方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序代码，当所述计算机程序代码被计算机运行时，使得所述计算机执行上述第三方面或第三方面任一种可能实现方式中的方法。

第十四方面，提供了一种计算机可读介质，用于存储计算机程序，该计算机程序包括用于执行第一方面或第一方面的任意可能的实现方式中的方法的指令。

第十五方面，提供了一种计算机可读介质，用于存储计算机程序，该计算机程序包括用于执行第二方面或第二方面的任意可能的实现方式中的方法的指令。

第十六方面，提供了一种计算机可读介质，用于存储计算机程序，该计算机程序包括用于执行第三方面或第三方面的任意可能的实现方式中的方法的指令。

第十七方面，提供了一种芯片系统，包括：输入接口、输出接口、至少一个处理器、存储器，所述输入接口、输出接口、所述处理器以及所述存储器之间通过内部连接通路互相通信，所述处理器用于执行所述存储器中的代码，当所述代码被执行时，所述处理器用于执行上述第一方面或第一方面的任意可能的实现方式中的方法。

第十八方面，提供了一种芯片系统，包括：输入接口、输出接口、至少一个处理器、存储器，所述输入接口、输出接口、所述处理器以及所述存储器之间通过内部连接通路互相通信，所述处理器用于执行所述存储器中的代码，当所述代码被执行时，所述处理器用于执行上述第二方面或第二方面的任意可能的实现方式中的方法。

第十九方面，提供了一种芯片系统，包括：输入接口、输出接口、至少一个处理器、存储器，所述输入接口、输出接口、所述处理器以及所述存储器之间通过内部连接通路互相通信，所述处理器用于执行所述存储器中的代码，当所述代码被执行时，所述处理器用于执行上述第三方面或第三方面的任意可能的实现方式中的方法。

附图说明

图1示出了本申请实施例的数据库系统的示意图。

图2示出了根据本申请实施例的读写节点的软件模块示意图。

图3示出了根据本申请实施例的只读节点的软件模块示意图。

图4示出了根据本申请实施例的存储主节点的软件模块示意图

图5示出了根据本申请实施例的数据处理方法的示意性流程图。

图6示出了根据本申请实施例的另一数据处理方法的示意性流程图。

图7示出了根据本申请实施例的另一数据处理方法的示意性流程图。

图8示出了根据本申请实施例的用于数据处理装置的示意性框图。

图9示出了根据本申请实施例的另一数据处理装置的示意性框图。

图10示出了根据本申请实施例的另一数据处理装置的示意性框图。

图11示出了根据本申请实施例的另一数据处理装置的示意性框图。

图12示出了根据本申请实施例的另一数据处理装置的示意性框图。

图13示出了根据本申请实施例的另一数据处理装置的示意性框图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

为便于理解，首先介绍一下本申请实施例中所涉及的相关术语。

节点：在数据库系统中，用于执行特定操作的网络实体，具体可以为一台物理机或者一台虚拟机。不同的节点根据其所提供的功能可以具有不同的名称。

数据库事务：也称事务，是数据库管理系统执行过程中的一个逻辑单位，由一个有限的数据库操作序列构成。

事务结束：指一个事务提交、中断，或者回滚。其中，提交指事务执行成功，回滚指恢复成事务开始前状态，中断指事务中途停止(可能回滚，也可能不回滚)。

读写分离：分布式数据库系统中，一台或多台数据库节点对外提供增删改查业务(包括查询、增加、删除、更新数据本身或数据库模型)的读写操作服务，另外的一台或多台数据库节点对外提供查询业务的只读操作服务。

数据库读写节点(简称“读写节点”)：对外提供增删改查业务的读写操作服务节点。

数据库只读节点(简称“只读节点”)：对外提供查询业务的只读操作服务的节点。

数据库存储节点(简称“存储节点”)：对外提供数据存储功能的节点。具体可以分为存储主节点和存储备节点两类。

应理解，一般情况下，存储节点中存储有数据，对于读写节点，可以向存储节点发送读请求，请求读取该存储节点中存储的数据，也可以向存储节点发送写请求，请求向该存储节点写入新的数据，或者，对该存储节点中存储的数据进行修改；对于只读节点，可以向存储节点发送只读请求，请求读取该存储节点中存储的数据，只读节点并不能对该数据进行修改，也无法写入新的数据。

读延迟(read delay)：分布式数据库系统中，在数据库只读节点中，客户端读取的数据与在数据库读写节点中更新的最新数据相比，滞后一定时间。在数据库读写节点中更新数据后，只读节点上的数据与读写节点上的数据不一致。

缓存池(buffer pool)：计算机中用于临时存储一个或多个数据页面的一块内存区域。

数据页面(简称“页面”)：数据库系统在内存中组织数据内容的数据结构，一个页面中包含多行数据。

回放日志(redo log)：由一组变更向量组成，每个变更向量记录了对数据库一个数据块的修改。其中，每条redo log由一个日志序列号(log sequence number，LSN)标记其执行顺序。

大多数复制协议(quorum replication)：一种数据复制协议，把数据、日志复制到多台存储节点上，使得数据、日志在至少大多数存储节点上保存。大多数指超过存储集群节点总数的一半。

已失效的数据的标识信息：用于标识已经失效的数据的信息，例如，已失效的数据页面的标识(identification，ID)。应理解，已失效是指存储节点中的数据被执行了写操作，例如，在某个事务执行前，a＝1，对应的数据页面的标识为001，在该事务执行之后，a＝1被修改成了a＝2，对应的数据页面的标识为002，那么a＝1便成为了已失效的数据，标识001即为已失效的数据的标识。

事务的标识信息：用于标识具体的事务，例如，事务的ID。应理解，存储节点可以接收到来自读写节点的多个不同的事务，该多个事务具有各自的标识，以便存储节点进行区分。若某个事务已提交，该存储节点就会记录并保存该事务的标识信息。

存储节点在按照读写节点的请求执行了某一事务之后，会将执行过程中修改数据的信息发送给只读节点进行备份，具体为已失效的数据的标识信息和已提交的事务的标识信息(在本申请中统称为事务状态元数据)，以便该只读节点根据已失效的数据的标识信息，确定哪些数据页面已经失效了，并根据已提交的事务的标识信息，确定已经提交的、最新的日志序列号LSN，从而根据该LSN，进行日志重放，获取最新版本的数据。

图1是本申请实施例所用的数据库系统100的示意图。如图1所示，该数据库系统100包括：应用层、计算层以及存储层。具体地，应用层包括应用层客户端110，计算层包括读写节点120和至少一个只读节点130，存储层包括存储主节点140。可选地，该存储层还可以包括至少一个存储备节点150。可选地，该数据库系统100还可以包括代理层，该代理层可以进一步包括至少一个代理节点。下面对数据库系统100的各个节点进行具体介绍。

1、应用层客户端110：用户发起操作请求(例如，结构化查询语言(structured query language，SQL)请求，SQL是用于数据库中的标准数据查询语言)的计算机节点，把该操作请求发送到代理节点。

2、代理节点：用于分发请求，把客户端的读写请求分发到读写节点，把只读请求分发到读写节点或只读节点。

3、计算层：负责实际执行请求，执行请求时需要的数据页面从节点的本地缓存或者下面的存储层获取。计算层包括读写节点和只读节点，统称为节点。每个节点上有负责页面数据的数据模块和负责事务信息的事务模块。

(1)读写节点120

读写节点120用于执行查询及修改(包括增加、删除、更新数据本身或数据库模型)语句的数据库计算机节点。在一种可能的实现方式中，如图2所示，读写节点120具体可以包括下列软件模块：

页面缓存池121：用于在内存中临时存放数据页面，便于快速访问；

日志记录122：用于暂时存放还未在存储节点完成提交持久化的redo log的一块内存区域；

可选地，读写节点120还可以包括全局事务状态元数据123，全局事务状态元数据123为用于记录事务的失效页面信息、已提交事务列表、LSN以及各个只读节点上缓存的数据页面版本等事务相关的元数据的一块内存区域。

(2)只读节点130

只读节点130用于执行查询只读语句的数据库计算机节点。在一种可能的实现方式中，如图3所示，只读节点120具体可以包括下列软件模块：

页面缓存池131：用于在内存中临时存放数据页面，便于快速访问。

事务状态元数据132：用于记录事务的失效页面信息、已提交事务列表、LSN等事务相关的元数据的一块内存区域。

元数据更新133：负责与存储节点的全局事务状态元数据交互的逻辑模块，更新在只读节点上的事务状态元数据。

4、存储层：负责存储数据库的数据内容和事务状态信息。

(1)存储主节点140

存储主节点140用于在内存解析、缓存redo log，缓存数据页面，维护事务状态元数据，和在磁盘中存储redo log和数据页面的计算机节点。在一种可能的实现方式中，如图4所示，存储主节点140具体可以包括下列软件模块：

日志缓存池141：用于在存储节点中临时存储由读写节点发送过来的日志的一块内存区域，主要是redo log；

快速日志解析器143：负责快速地解析redo log，把redo log与所操作的页面对应起来，存于日志缓存池中；

页面缓存池144：用于在内存中临时存放数据页面，便于快速访问；

日志存储库145：用于在存储节点的磁盘内持久化存储redo log，不同存储节点的日志存储库间通过大多数复制协议保存redo log的多个副本；

数据存储库146：用于在存储节点的磁盘内持久化存储数据页面；

可选地，存储主节点140还可以包括全局事务状态元数据142，全局事务状态元数据142为用于记录事务的失效页面信息、已提交事务列表、LSN以及各个只读节点上缓存的数据页面版本等事务相关的元数据的一块内存区域。

(2)存储备节点150

存储备节点150与存储主节点140构成存储集群，其中，存储备节点150可以存在一个或多个。存储主节点140和存储备节点150可以统称为存储节点，存储节点互相之间可以通过网络通信，且存储主节点140与至少一个存储备节点150之间通过大多数复制协议同步日志存储库。由于存储备节点150的功能与存储主节点140类似，此处不再赘述。

应理解，存储主节点和存储备节点的角色可能在运行时会发生变更，即某个存储主节点变为存储备节点，而某个存储备节点转变为存储主节点。因此，可以在存储备节点(全部存储备节点，或者，有可能转变为存储主节点的部分存储备节点)上也设置全局事务状态元数据模块，存储全局事务状态元数据，以便当该存储备节点转变为存储主节点时，能够向只读节点快速提供事务状态元数据，但本申请实施例对此不作限定。

还应理解，在上述数据库系统100中，每一层之间可以通过网络进行通信，但每一层只与相邻的上下层进行通信，不跨层通信。每一层内部不同节点之间可以通过网络、内存访问、磁盘访问进行通信。

但是，读写节点和只读节点之间通过日志的复制实现数据同步会产生读延迟的问题。这是因为在读写节点上请求更新的数据，要经过秒级到分钟级的延迟才能被只读节点感知，例如，存储节点在按照读写节点的请求执行了数据的更新之后，会周期性地将修改数据的信息发送给只读节点进行备份，这个周期可能是30s、1min等固定的时间段，这就会导致客户端通过只读节点读取的数据都是秒级到分钟级之前的旧数据。这对于数据延迟高度敏感的业务(例如，礼包兑换、红包发送等)是不可接受的。因此，由于只读节点的读延迟的存在，对数据延迟高度敏感的业务无法通过只读节点实现数据的只读操作。

目前存在一种技术，在包括SQL主节点、SQL备节点、分布式存储集群以及Amazon S3(备份分布式存储集群中的数据的存储库，用于容灾)等硬件模块的系统架构中，SQL主节点处理数据库的读写操作，存入或读取分布式集群的redo log数据；SQL备节点从SQL主节点或分布式存储集群获取redo log数据，进行数据库的只读操作；存储集群通过大多数复制协议存储SQL主节点发送的redo log，并响应SQL主节点和SQL备节点的读取redo log对应的数据页面的请求。存储集群中的数据会以一定的策略，通过分布式写的方法，备份到Amazon S3中。在该系统架构中，SQL(主/备)节点与存储层分离，由存储节点提供统一的数据写入和数据读取服务，SQL主节点和SQL备节点之间通过同步redo log和更新已持久化的redo log的LSN，来支持SQL备节点的只读事务从已经在存储集群中保存的redo log中构造数据页面。

但是，上述技术没有完全解决SQL只读节点的读延迟问题。例如，在SQL备节点收到SQL主节点发送的最新已持久化的redo log的LSN的间隔时间里，一个事务1在SQL读写节点上更新了数据，另一个在SQL备节点上的只读事务2并不知道事务1的提交，只能根据旧的已持久化的redo log的LSN构造一个旧版本的数据页面，这个旧版本的数据页面与读写节点上最新的数据页面不一致。在实际的使用中，在SQL备节点上构造的数据页面比SQL主节点上的最新数据页面平均滞后20ms。

综上，在核心业务系统中，迫切需要实现数据强一致性，即零读延迟，并且能实现只读能力扩展性的读写分离的数据库。

图5示出了本申请实施例的数据处理方法500的示意性流程图。该方法500可以应用于图1所示的通信系统100，但本申请实施例不限于此。

S510，读写节点向存储主节点发送第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作，所述第一事务的信息可以包括至少一个日志；

则对应地，所述存储主节点接收读写节点发送的第一事务的信息；

S520，所述存储主节点根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务；

S530，当所述第一事务结束时，所述存储主节点生成第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息；

S540，所述存储主节点向至少一个只读节点发送所述第一事务状态元数据；

则对应地，所述至少一个只读节点接收所述第一事务状态元数据。

S550，所述至少一个只读节点根据所述第一事务状态元数据，对本地事务状态元数据进行更新。

具体地，读写节点可以向存储主节点发送第一事务的信息，用于请求执行第一数据的写操作，该第一事务的信息可以包括至少一个日志，下面以redo log为例进行说明。redo log的内容可以包括操作的类型、操作的内容和日志序列号LSN等。可选地，redo log可以被该读写节点暂时存放于日志记录122中，通过网络通信(例如RPC)向存储主节点发送要数据库读写操作的redo log，并等待存储节点的响应。存储主节点在收到第一事务的信息之后，可以对其中包括的redo log进行解析，把redo log匹配到对应的数据页面上，即确定所述第一数据。可选地，存储主节点可以将redo log存入日志缓存池141中，并通过快速日志解析器143对redo log进行解析，把redo log匹配到对应的数据页面上。

应理解，在本申请实施例中，第一事务状态元数据包括已失效的数据的标识信息和第一事务的标识信息，存储主节点将这些信息发送给只读节点，以便只读节点根据已失效的数据的标识信息，确定缓存中的哪些数据页面已经失效了，并根据第一事务的标识信息，确定已经结束(提交、中断或回滚)的、最新的日志序列号LSN，从而根据该LSN，进行日志重放，获取最新版本的数据。

还应理解，事务结束指一个事务提交、中断或回滚，其中，提交指事务执行成功，回滚指恢复成事务开始执行前的状态，中断指事务中途停止执行。存储主节点在进行解析的时候，会判断第一事务是否结束，当该第一事务结束时，存储主节点可以生成包括已失效的数据的标识信息和该第一事务的标识信息的第一事务状态元数据，具体可以为已失效页面的标识ID和第一事务的标识ID，但本申请实施例对此不作限定。

可选地，该第一事务状态元数据可以包括被回放日志redo log操作修改后应该在缓存中失效的数据页面列表、已提交的事务列表、现有执行中的事务下可见的LSN等信息。可选地，若该存储主节点包括全局事务状态元数据142，该存储主节点可以将第一事务状态元数据存入全局事务状态元数据142中；若该存储主节点不包括全局事务状态元数据142，该存储主节点可以将第一事务状态元数据发送给读写节点。

作为一个可选的实施例，在所述存储主节点根据所述第一数据的当前状态，生成第一事务状态元数据之后，所述方法还包括：

所述存储主节点向所述读写节点发送响应消息，所述响应消息用于表示所述第一事务的执行结果；

则对应地，所述读写节点接收所述存储主节点发送的响应消息。

具体地，存储主节点还可以向读写节点发送响应消息，进行网络通信的响应，告知读写节点redo log的执行结果。应理解，一个事务的执行结果具体可以包括该事务的提交(commit)、中断(interrupt)或者回滚(rollback)，本申请实施例对此不作限定。可选地，读写节点接收该响应消息，在获知第一事务提交后，可以从日志记录122里把对应的redo log删除。

作为一个可选的实施例，所述第一事务的信息包括至少一个日志，所述至少一个日志中的第一日志携带第一标识，所述第一标识用于标识所述第一事务结束，且所述第一日志的日志序列号为所述至少一个日志中日志序列号的最大值。

具体地，上述至少一个日志中存在第一日志，携带第一标识，又称为结束标识，用于标识第一事务结束。在一种可能的实现方式中，可以通过以新增end类型的redo log来标记事务结束，但本申请实施例对此不作限定。

在本申请实施例中，存储主节点可以通过第一标识可以快速识别一个事务的结束，从而触发事务状态元数据的生成，从而进一步消除只读节点的读延迟，提高系统性能。应理解，存储主节点在根据redo log构建某个版本的数据页面时，如果碰到第一标识(例如，end类型)的redo log可直接忽略，即不对数据做任何处理。这是由于携带第一标识的redo log仅仅用于表示事务结束，并无其他额外的含义，即这一类型的redo log不会请求对数据做任何修改。

作为一个可选的实施例，所述存储主节点根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务，包括：所述存储主节点对所述至少一个日志进行解析；所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点。

具体地，存储主节点可以对第一事务所包括的至少一个日志进行解析，并且，在存储备节点存在的情况下，存储主节点可以将redo log存入日志缓存池141中，通过复制协议(例如，大多数复制协议)把该至少一个日志(例如，redo log)存储在大多数存储备节点的日志存储库145内。

作为一个可选的实施例，所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点，包括：

在所述存储主节点对所述至少一个日志进行解析的同时，所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点。

所述存储主节点向所述读写节点发送所述第一事务状态元数据。

具体地，存储主节点在生成第一事务状态元数据之后，还可以将其发送给读写节点，即在上述数据库系统100中，读写节点120还包括全局事务状态元数据123，用于存储事务状态元数据，该事务状态元数据可以是该读写节点自己生成的，也可以是该存储主节点发送给该读写节点的，本申请实施例对此不作限定。

应理解，存储全局事务状态元数据的模块位于读写节点上的好处是，读写节点一般是由一个外部的管理器或者管理员指定的，每个只读节点有明确的管理配置信息从哪个节点可以获取到读写节点上的事务状态元数据信息。而由于存储节点间通过一致性复制协议备份数据，存储主节点与存储备节点的角色可能在运行时发生变更，即某个存储主节点变为存储备节点，而某个存储备节点转变为存储主节点。若存储全局事务状态元数据的模块位于存储主节点，只读节点需要额外的机制识别哪个存储节点是存储主节点，从而获取事务状态元数据信息。因此，本申请实施例的方法便于管理，能够提高系统的灵活性。

图6示出了本申请实施例的另一数据处理方法600的示意性流程图。该方法600可以应用于图1所示的通信系统100，但本申请实施例不限于此。

S610，读写节点向存储主节点发送第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作，所述第一事务的信息可以包括至少一个日志；

S620，所述存储主节点根据所述第一事务的信息，确定所述第一数据，并执行素数第一事务；

S630，所述存储主节点向所述读写节点接收所述存储主节点发送的响应消息，所述响应消息用于表示所述第一事务的执行结果；

则对应地，所述读写节点接收所述存储主节点发送的响应消息；

S640，所述读写节点获取第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息；

S650，当所述读写节点接收到所述响应消息时，所述读写节点向至少一个只读节点发送所述第一事务状态元数据；

则对应地，所述至少一个只读节点接收所述读写节点发送的第一事务状态元数据；

S660，所述至少一个只读节点根据所述第一事务状态元数据，对本地事务状态元数据进行更新。

应理解，事务结束指一个事务提交、中断或回滚，其中，提交指事务执行成功，回滚指恢复成事务开始执行前的状态，中断指事务中途停止执行。读写节点可以判断第一事务是否结束，并在该第一事务结束时，获取包括已失效的数据的标识信息和该第一事务的标识信息的第一事务状态元数据，具体可以为已失效页面的标识ID和第一事务的标识ID，但本申请实施例对此不作限定。

可选地，该第一事务状态元数据可以包括被回放日志redo log操作修改后应该在缓存中失效的数据页面列表、已提交的事务列表、现有执行中的事务下可见的LSN等信息。可选地，该读写节点包括全局事务状态元数据123，用于存储事务状态元数据，该事务状态元数据可以是该读写节点自己生成的，也可以是该存储主节点发送给该读写节点的，本申请实施例对此不作限定。

在存储主节点对上述写操作执行完成之后，会向读写节点发送的响应消息，用于表示该第一事务的执行结果。读写节点在接收到该响应消息时，便会向至少一个只读节点发送该第一事务状态元数据，使得该至少一个只读节点根据该第一事务状态元数据，对本地事务状态元数据进行更新。可选地，读写节点在接收该响应消息，获知第一事务的执行结果后，可以从日志记录122里把对应的redo log删除。

作为一个可选的实施例，在所述读写节点向至少一个只读节点发送第一事务状态元数据之前，所述方法还包括：

所述读写节点接收所述存储主节点发送的所述第一事务状态元数据，或

当所述第一事务结束时，所述读写节点生成所述第一事务状态元数据。

具体地，第一事务状态元数据可以是读写节点自己确定的，也可以是该存储主节点生成之后发送给该读写节点的，本申请实施例对此不作限定。

在本申请实施例中，通过第一标识可以快速识别一个事务的结束，从而触发事务元数据的生成，可以进一步消除只读节点的读延迟，提高系统性能。应理解，存储主节点在根据redo log构建某个版本的数据页面时，如果碰到第一标识(例如，end类型)的redo log可直接忽略，即不对数据做任何处理。这是由于携带第一标识的redo log仅仅用于表示事务结束，并无其他额外的含义，即这一类型的redo log不会请求对数据做任何修改。

在方法500和方法600中，只读节点都是通过推送方式获取事务状态元数据的，下面介绍只读节点以拉取方式获取事务状态元数据的方法700。这几个实施例都可以使已提交事务的信息及时在只读节点中得知。当一个只读事务在只读节点上执行时，它能获取当前系统最新的可见LSN，并根据此LSN获取相应的数据页面。因此，本申请能够解决只读节点上的事务状态元数据信息落后于读取节点上的事务状态元数据，导致只读节点读取的数据页面与读写节点上的数据页面内容不一致，即读延迟的问题。

图7示出了本申请实施例的另一数据处理方法700的示意性流程图。该方法700可以应用于图1所示的通信系统100，但本申请实施例不限于此。应理解，方法700中的只读节点为上述至少一个只读节点中的任意一个。

S710，第一客户端向只读节点发送第二请求消息，所述第二请求消息用于请求对至少一个存储节点中存储的第二数据执行只读操作，所述至少一个存储节点包括存储主节点；

则对应地，该只读节点接收第一客户端发送的第二请求消息；

S720，所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，所述第一请求消息用于请求更新本地事务状态元数据，所述本地事务状态元数据包括已失效的数据的标识信息和已提交的事务的标识信息；

则对应地，所述存储主节点或所述读写节点接收所述只读节点发送的第一请求消息；

S730，所述存储主节点或所述读写节点根据所述第一请求消息，向所述只读节点发送第一事务状态元数据

则对应地，所述只读节点接收所述存储主节点或所述读写节点发送的第一事务状态元数据；

S740，所述只读节点根据所述第一事务状态元数据，对所述本地事务状态元数据进行更新；

S750，所述只读节点根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据。

具体地，第一客户端可以向只读节点发送第二请求消息，请求对第二数据执行只读操作，该只读节点接收该第二请求消息，向存储主节点或读写节点发送第一请求消息，用于请求更新本地事务状态元数据。应理解，若上述存储全局事务状态元数据的模块位于存储主节点，该只读节点便可以向存储主节点发送上述第一请求消息，若上述存储全局事务状态元数据的模块位于读写节点，该只读节点便可以向读写节点发送上述第一请求消息，本申请实施例对此不作限定。

存储主节点或读写节点在收到只读节点发送的第一请求消息之后，向该只读节点发送新生成的事务状态元数据。应理解，该新生成的事务状态元数据可以是只读节点的两次请求消息之间存储主节点或读写节点生成的元数据。假设在上次接收该只读节点的请求和本次接收该只读节点的请求之间，存储主节点或读写节点仅生成了第一事务状态元数据，那么该存储主节点或读写节点可以将第一事务状态元数据发送给该只读节点。该只读节点根据接收到的事务状态元数据，对本地事务状态元数据进行更新，从而根据更新后的本地事务状态元数据，从至少一个存储节点执行只读操作。

可选地，上述更新过程都可以由该只读节点的元数据更新133模块执行，且只读节点的本地事务状态元数据被存储在事务状态元数据132对应的内存区域中。应理解，存储节点可以包括存储主节点和至少一个存储备节点，但只有存储主节点才可以生成并存储事务状态元数据。

作为一个可选的实施例，所述只读节点根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据，包括：

所述只读节点根据更新后的所述本地事务状态元数据，确定第二标识，所述第二标识对应所述第二数据的最新版本；

所述只读节点向所述至少一个存储节点发送第三请求消息，所述第三请求消息用于请求读取所述第二标识对应的所述第二数据；

所述只读节点接收所述至少一个存储节点发送的所述第二标识对应的所述第二数据。

具体地，只读节点可以根据更新后的本地事务状态元数据，获取对应第二数据最新版本的第二标识，从而从至少一个存储节点处读取最新版本的第二数据。

在一种可能的实现方式中，只读节点可以根据已失效的数据的标识信息和已提交的事务的标识信息，获取当前可见LSN，该当前可见LSN是指已提交事务中所包括的日志序列号的最大值，例如lsn1，并根据lsn1向存储节点发送读取相应版本的数据页面的请求，该请求包括数据页面的编号和版本号等信息。存储节点在接收到该请求后，构建出版本号为lsn1的数据页面，具体可以按照已提交事务的日志序列号，进行日志重放，直到执行完已提交事务中所包括的日志序列号的最大值lsn1，再将lsn1的最新的数据页面通过网络返回给只读节点。只读节点把返回的数据页面存放于页面缓存池131中，读取相应版本的数据页面成功。

作为一个可选的实施例，在所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息之前，所述方法还包括：

所述只读节点缓存所述第二请求消息，并开启定时器；

所述只读节点接收第二客户端发送的至少一个第四请求消息，所述至少一个第四请求消息用于请求对所述至少一个存储节点中存储的第三数据执行只读操作；

所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，包括：

当所述只读节点中缓存的消息的数量超过第一阈值，或者所述定时器超时，所述只读节点向所述存储主节点或所述读写节点发送所述第一请求消息。

应理解，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

上文中结合图1至图7，详细描述了根据本申请实施例的数据处理方法，下面将结合图8至图13，详细描述根据本申请实施例的数据处理装置。

图8示出了本申请实施例提供的数据处理装置800，该装置800包括：

接收单元810，用于接收读写节点发送的第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作；

处理单元820，用于根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务；

所述处理单元820还用于：

当所述第一事务结束时，生成第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息；

发送单元830，用于向至少一个只读节点发送所述第一事务状态元数据。

本申请实施例的数据处理装置，通过存储主节点在事务结束时主动将事务状态元数据推送给只读节点，使得只读节点能够获取到最新的事务状态，保证在读写节点和只读节点上只读操作获取的数据页面的内容一致，有利于消除只读节点的读延迟，从而提高用户体验。

可选地，所述发送单元830还用于：在根据所述第一数据的当前状态，生成第一事务状态元数据之后，向所述读写节点发送响应消息，所述响应消息用于表示所述第一事务的执行结果。

可选地，所述第一事务的信息包括至少一个日志，所述至少一个日志中的第一日志携带第一标识，所述第一标识用于标识所述第一事务结束，且所述第一日志的日志序列号为所述至少一个日志中日志序列号的最大值。

可选地，所述处理单元具体用于：对所述至少一个日志进行解析；将所述至少一个日志按照复制协议复制到至少一个存储备节点。

可选地，所述处理单元具体用于：在对所述至少一个日志进行解析的同时，将所述至少一个日志按照复制协议复制到至少一个存储备节点。

可选地，所述发送单元830还用于：在根据所述第一数据的当前状态，生成第一事务状态元数据之后，向所述读写节点发送所述第一事务状态元数据。

应理解，这里的装置800以功能单元的形式体现。这里的术语“单元”可以指应用特有集成电路(application specific integrated circuit，ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。在一个可选例子中，本领域技术人员可以理解，装置800可以具体为上述实施例中的存储主节点，装置800可以用于执行上述方法实施例中与存储主节点对应的各个流程和/或步骤，为避免重复，在此不再赘述。

图9示出了本申请实施例提供的另一数据处理装置900，该装置900包括：

发送单元910，用于向存储主节点发送第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作，所述第一事务的信息包括至少一个日志；

接收单元920，用于接收所述存储主节点发送的响应消息，所述响应消息用于表示所述第一事务的执行结果；

所述发送单元910还用于：

当接收到所述响应消息时，向至少一个只读节点发送第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息。

本申请实施例的数据处理装置，通过读写节点在接收到事务的执行结果的响应时主动将事务状态元数据推送给只读节点，使得只读节点能够获取到最新的事务状态，保证在读写节点和只读节点上只读操作获取的数据页面的内容一致，有利于消除只读节点的读延迟，从而提高用户体验。

可选地，所述接收单元920还用于：在向至少一个只读节点发送第一事务状态元数据之前，接收所述存储主节点发送的所述第一事务状态元数据，或所述装置还包括：处理单元，用于当所述第一事务结束时，生成所述第一事务状态元数据。

应理解，这里的装置900以功能单元的形式体现。这里的术语“单元”可以指应用特有集成电路(application specific integrated circuit，ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。在一个可选例子中，本领域技术人员可以理解，装置900可以具体为上述实施例中的读写节点，装置900可以用于执行上述方法实施例中与读写节点对应的各个流程和/或步骤，为避免重复，在此不再赘述。

图10示出了本申请实施例提供的另一数据处理装置1000，该装置1000包括：

接收单元1010，用于接收第一客户端发送的第二请求消息，所述第二请求消息用于请求对至少一个存储节点中存储的第二数据执行只读操作，所述至少一个存储节点包括存储主节点；

发送单元1020，用于根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，所述第一请求消息用于请求更新本地事务状态元数据，所述本地事务状态元数据包括已失效的数据的标识信息和已提交的事务的标识信息；

所述接收单元1010还用于：

接收所述存储主节点或所述读写节点根据所述第一请求消息发送的第一事务状态元数据；

处理单元1030，用于根据所述第一事务状态元数据，对所述本地事务状态元数据进行更新；

所述处理单元1030还用于：根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据。

本申请实施例的数据处理装置，通过只读节点在执行只读操作之前，向存储事务状态元数据的存储主节点或只读节点发送更新请求，存储主节点或只读节点在接收到该更新请求之后才向只读节点发送最新的事务状态元数据，使得只读节点能够在执行只读操作前获取到最新的事务状态，保证在读写节点和只读节点上只读操作获取的数据页面的内容一致，有利于消除只读节点的读延迟，从而提高用户体验。

可选地，所述处理单元1030还用于：根据更新后的所述本地事务状态元数据，确定第二标识，所述第二标识对应所述第二数据的最新版本；所述发送单元1020还用于：向所述至少一个存储节点发送第三请求消息，所述第三请求消息用于请求读取所述第二标识对应的所述第二数据；所述接收单元1010还用于：接收所述至少一个存储节点发送的所述第二标识对应的所述第二数据。

可选地，所述处理单元1030还用于：在根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息之前，缓存所述第二请求消息，并开启定时器；所述接收单元1010还用于：接收第二客户端发送的至少一个第四请求消息，所述至少一个第四请求消息用于请求对所述至少一个存储节点中存储的第三数据执行只读操作；所述发送单元1020具体用于：当所述装置中缓存的消息的数量超过第一阈值，或者所述定时器超时，向所述存储主节点或所述读写节点发送所述第一请求消息。

应理解，这里的装置1000以功能单元的形式体现。这里的术语“单元”可以指应用特有集成电路(application specific integrated circuit，ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。在一个可选例子中，本领域技术人员可以理解，装置1000可以具体为上述实施例中的只读节点，装置1000可以用于执行上述方法实施例中与只读节点对应的各个流程和/或步骤，为避免重复，在此不再赘述。

图11示出了本申请实施例提供的另一数据处理装置1100。该装置1100包括至少一个处理器1110、存储器1120和通信接口1130；所述至少一个处理器1110、所述存储器1120和所述通信接口1130均通过内部通路连接；

所述存储器1120，用于存储计算机执行指令；

所述至少一个处理器1110，用于执行所述存储器1120存储的计算机执行指令，使得所述装置1100可以通过所述通信接口1130与其他装置进行数据交互来执行上述方法实施例1100提供的数据处理方法。

其中，该至少一个处理器1110用于执行以下操作：

接收读写节点发送的第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作；

根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务；

当所述第一事务结束时，根据所述第一数据的当前状态，生成第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息；

向至少一个只读节点发送所述第一事务状态元数据。

应理解，装置1100可以具体为上述实施例中的存储主节点，并且可以用于执行上述方法实施例500中与存储主节点对应的各个步骤和/或流程。

图12示出了本申请实施例提供的另一数据处理装置1200。该装置1200包括至少一个处理器1210、存储器1220和通信接口1230；所述至少一个处理器1210、所述存储器1220和所述通信接口1230均通过内部通路连接；

所述存储器1220，用于存储计算机执行指令；

所述至少一个处理器1210，用于执行所述存储器1220存储的计算机执行指令，使得所述装置1200可以通过所述通信接口1230与其他装置进行数据交互来执行上述方法实施例1200提供的数据处理方法。

其中，该至少一个处理器1210用于执行以下操作：

向存储主节点发送第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作，所述第一事务的信息包括至少一个日志；

接收所述存储主节点发送的响应消息，所述响应消息用于表示所述第一事务的执行结果；

应理解，装置1200可以具体为上述实施例中的读写节点，并且可以用于执行上述方法实施例600中与读写节点对应的各个步骤和/或流程。

图13示出了本申请实施例提供的另一数据处理装置1300。该装置1300包括至少一个处理器1310、存储器1320和通信接口1330；所述至少一个处理器1310、所述存储器1320和所述通信接口1330均通过内部通路连接；

所述存储器1320，用于存储计算机执行指令；

所述至少一个处理器1310，用于执行所述存储器1320存储的计算机执行指令，使得所述装置1300可以通过所述通信接口1330与其他装置进行数据交互来执行上述方法实施例1300提供的数据处理方法。

其中，该至少一个处理器1310用于执行以下操作：

接收第一客户端发送的第二请求消息，所述第二请求消息用于请求对至少一个存储节点中存储的第二数据执行只读操作，所述至少一个存储节点包括存储主节点；

根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，所述第一请求消息用于请求更新本地事务状态元数据，所述本地事务状态元数据包括已失效的数据的标识信息和已提交的事务的标识信息；

根据所述第一事务状态元数据，对所述本地事务状态元数据进行更新；

根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据。

应理解，装置1300可以具体为上述实施例中的只读节点，并且可以用于执行上述方法实施例700中与只读节点对应的各个步骤和/或流程。

应理解，在本申请实施例中，至少一个处理器可以包括中央处理单元(central processing unit，CPU)，该处理器还可以包括其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以是以下的任一种或任一种组合：随机存取存储器(random access memory，RAM)、只读存储器(read only memory，ROM)、非易失性存储器(non-volatile memory，NVM)、固态硬盘(solid state drives，SSD)、机械硬盘、磁盘、磁盘整列等存储介质。

通信接口用于本装置与其他设备之间的数据交互。通信接口可以包括以下的任一种或任一种组合：网络接口(例如以太网接口)、无线网卡等具有网络接入功能的器件。

可选地，上述至少一个处理器510、存储器520和通信接口530可以通过总线连接，该总线可以包括地址总线、数据总线、控制总线等。总线可以包括以下的任一种或任一种组合：工业标准体系结构(industry standard architecture，ISA)总线、外设组件互连标准(peripheral component interconnect，PCI)总线、扩展工业标准结构(extended industry standard architecture，EISA)总线等有线数据传输的器件。

在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器执行存储器中的指令，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

应理解，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以意识到，结合本文中所公开的实施例中描述的各方法步骤和单元，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各实施例的步骤及组成。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种数据处理方法，其特征在于，包括：

存储主节点接收读写节点发送的第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作；

所述存储主节点根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务；

当所述第一事务结束时，所述存储主节点生成第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息；

所述存储主节点向至少一个只读节点发送所述第一事务状态元数据。
根据权利要求1所述的方法，其特征在于，在所述存储主节点根据所述第一数据的当前状态，生成第一事务状态元数据之后，所述方法还包括：

所述存储主节点向所述读写节点发送响应消息，所述响应消息用于表示所述第一事务的执行结果。
根据权利要求1或2所述的方法，其特征在于，所述第一事务的信息包括至少一个日志，所述至少一个日志中的第一日志携带第一标识，所述第一标识用于标识所述第一事务结束，且所述第一日志的日志序列号为所述至少一个日志中日志序列号的最大值。
根据权利要求3所述的方法，其特征在于，所述存储主节点根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务，包括：

所述存储主节点对所述至少一个日志进行解析；

所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点。
根据权利要求4所述的方法，其特征在于，所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点，包括：

在所述存储主节点对所述至少一个日志进行解析的同时，所述存储主节点将所述至少一个日志按照复制协议复制到至少一个存储备节点。
根据权利要求1至5中任一项所述的方法，其特征在于，在所述存储主节点根据所述第一数据的当前状态，生成第一事务状态元数据之后，所述方法还包括：

所述存储主节点向所述读写节点发送所述第一事务状态元数据。
一种数据处理方法，其特征在于，包括：

读写节点向存储主节点发送第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作；

所述读写节点接收所述存储主节点发送的响应消息，所述响应消息用于表示所述第一事务的执行结果；

当所述读写节点接收到所述响应消息时，所述读写节点向至少一个只读节点发送第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息。
根据权利要求7所述的方法，其特征在于，在所述读写节点向至少一个只读节点发送第一事务状态元数据之前，所述方法还包括：

所述读写节点接收所述存储主节点发送的所述第一事务状态元数据，或

当所述第一事务结束时，所述读写节点生成所述第一事务状态元数据。
根据权利要求7或8所述的方法，其特征在于，所述第一事务的信息包括至少一个日志，所述至少一个日志中的第一日志携带第一标识，所述第一标识用于标识所述第一事务结束，且所述第一日志的日志序列号为所述至少一个日志中日志序列号的最大值。
一种数据处理方法，其特征在于，包括：

只读节点接收第一客户端发送的第二请求消息，所述第二请求消息用于请求对至少一个存储节点中存储的第二数据执行只读操作，所述至少一个存储节点包括存储主节点；

所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，所述第一请求消息用于请求更新本地事务状态元数据，所述本地事务状态元数据包括已失效的数据的标识信息和已提交的事务的标识信息；

所述只读节点接收所述存储主节点或所述读写节点根据所述第一请求消息发送的第一事务状态元数据，并对所述本地事务状态元数据进行更新；

所述只读节点根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据。
根据权利要求10所述的方法，其特征在于，所述只读节点根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据，包括：

所述只读节点根据更新后的所述本地事务状态元数据，确定第二标识，所述第二标识对应所述第二数据的最新版本；

所述只读节点向所述至少一个存储节点发送第三请求消息，所述第三请求消息用于请求读取所述第二标识对应的所述第二数据；

所述只读节点接收所述至少一个存储节点发送的所述第二标识对应的所述第二数据。
根据权利要求10或11所述的方法，其特征在于，在所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息之前，所述方法还包括：

所述只读节点缓存所述第二请求消息，并开启定时器；

所述只读节点接收第二客户端发送的至少一个第四请求消息，所述至少一个第四请求消息用于请求对所述至少一个存储节点中存储的第三数据执行只读操作；

所述只读节点根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，包括：

当所述只读节点中缓存的消息的数量超过第一阈值，或者所述定时器超时，所述只读节点向所述存储主节点或所述读写节点发送所述第一请求消息。
一种数据处理装置，其特征在于，包括：

接收单元，用于接收读写节点发送的第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作；

处理单元，用于根据所述第一事务的信息，确定所述第一数据，并执行所述第一事务；

所述处理单元还用于：

当所述第一事务结束时，生成第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息；

发送单元，用于向至少一个只读节点发送所述第一事务状态元数据。
根据权利要求13所述的装置，其特征在于，所述发送单元还用于：

在根据所述第一数据的当前状态，生成第一事务状态元数据之后，向所述读写节点发送响应消息，所述响应消息用于表示所述第一事务的执行结果。
根据权利要求13或14所述的装置，其特征在于，所述第一事务的信息包括至少一个日志，所述至少一个日志中的第一日志携带第一标识，所述第一标识用于标识所述第一事务结束，且所述第一日志的日志序列号为所述至少一个日志中日志序列号的最大值。
根据权利要求15所述的装置，其特征在于，所述处理单元具体用于：

对所述至少一个日志进行解析；

将所述至少一个日志按照复制协议复制到至少一个存储备节点。
根据权利要求16所述的装置，其特征在于，所述复制单元具体用于：

在对所述至少一个日志进行解析的同时，将所述至少一个日志按照复制协议复制到至少一个存储备节点。
根据权利要求13至17中任一项所述的装置，其特征在于，所述发送单元还用于：

在根据所述第一数据的当前状态，生成第一事务状态元数据之后，向所述读写节点发送所述第一事务状态元数据。
一种数据处理装置，其特征在于，包括：

发送单元，用于向存储主节点发送第一事务的信息，所述第一事务的信息用于请求对所述存储主节点中存储的第一数据执行写操作，所述第一事务的信息包括至少一个日志；

接收单元，用于接收所述存储主节点发送的响应消息，所述响应消息用于表示所述第一事务的执行结果；

所述发送单元还用于：

当接收到所述响应消息时，向至少一个只读节点发送第一事务状态元数据，所述第一事务状态元数据包括已失效的数据的标识信息和所述第一事务的标识信息。
根据权利要求19所述的装置，其特征在于，所述接收单元还用于：

在向至少一个只读节点发送第一事务状态元数据之前，接收所述存储主节点发送的所述第一事务状态元数据，或

所述装置还包括：

处理单元，用于当所述第一事务结束时，生成所述第一事务状态元数据。
根据权利要求19或20所述的装置，其特征在于，所述第一事务的信息包括至少一个日志，所述至少一个日志中的第一日志携带第一标识，所述第一标识用于标识所述第一事务结束，且所述第一日志的日志序列号为所述至少一个日志中日志序列号的最大值。
一种数据处理装置，其特征在于，包括：

接收单元，用于接收第一客户端发送的第二请求消息，所述第二请求消息用于请求对至少一个存储节点中存储的第二数据执行只读操作，所述至少一个存储节点包括存储主节点；

发送单元，用于根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息，所述第一请求消息用于请求更新本地事务状态元数据，所述本地事务状态元数据包括已失效的数据的标识信息和已提交的事务的标识信息；

所述接收单元还用于：

接收所述存储主节点或所述读写节点根据所述第一请求消息发送的第一事务状态元数据；

处理单元，用于根据所述第一事务状态元数据，对所述本地事务状态元数据进行更新；

所述处理单元还用于：

根据更新后的所述本地事务状态元数据，从所述至少一个存储节点读取所述第二数据。
根据权利要求22所述的装置，其特征在于，所述处理单元还用于：

根据更新后的所述本地事务状态元数据，确定第二标识，所述第二标识对应所述第二数据的最新版本；

所述发送单元还用于：

向所述至少一个存储节点发送第三请求消息，所述第三请求消息用于请求读取所述第二标识对应的所述第二数据；

所述接收单元还用于：

接收所述至少一个存储节点发送的所述第二标识对应的所述第二数据。
根据权利要求22或23所述的装置，其特征在于，所述处理单元还用于：

在根据所述第二请求消息，向所述存储主节点或读写节点发送第一请求消息之前，缓存所述第二请求消息，并开启定时器；

所述接收单元还用于：

接收第二客户端发送的至少一个第四请求消息，所述至少一个第四请求消息用于请求对所述至少一个存储节点中存储的第三数据执行只读操作；

所述发送单元具体用于：

当所述装置中缓存的消息的数量超过第一阈值，或者所述定时器超时，向所述存储主节点或所述读写节点发送所述第一请求消息。
一种数据处理系统，其特征在于，所述数据处理系统包括：

权利要求13至18中任一项所述的装置、权利要求19至21中任一项所述的装置以及权利要求22至24中任一项所述的装置。