[go: up one dir, main page]

CN116303385A - 一种数据稽核方法、装置、电子设备及存储介质 - Google Patents

一种数据稽核方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116303385A
CN116303385A CN202310140103.7A CN202310140103A CN116303385A CN 116303385 A CN116303385 A CN 116303385A CN 202310140103 A CN202310140103 A CN 202310140103A CN 116303385 A CN116303385 A CN 116303385A
Authority
CN
China
Prior art keywords
auditing
data
data flow
flow graph
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310140103.7A
Other languages
English (en)
Inventor
刘建波
董冰
程赓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Tower Co Ltd
Original Assignee
China Tower Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Tower Co Ltd filed Critical China Tower Co Ltd
Priority to CN202310140103.7A priority Critical patent/CN116303385A/zh
Publication of CN116303385A publication Critical patent/CN116303385A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种数据稽核方法、装置、电子设备及存储介质,方法包括:获取数据流图库中的数据流图,所述数据流图包括如下至少一项:系统数据流图、系统库表结构图和系统部署图,所述系统数据流图包括系统间数据流图或业务线数据流图,所述系统库表结构图表示至少一个业务系统匹配数据库的数据表,所述系统部署图表示至少一个业务系统对应的硬软件部署图;依据所述数据流图确定所述至少一个业务系统中的稽核目标,以及确定匹配所述稽核目标的预设稽核规则;依据所述预设稽核规则对所述稽核目标进行数据稽核处理,得到数据稽核结果,所述数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果。本发明可以提高对数据稽核的效果。

Description

一种数据稽核方法、装置、电子设备及存储介质
技术领域
本发明涉及计算机信息管理系统领域,尤其涉及一种数据稽核方法、装置、设备及存储介质。
背景技术
现如今,许多行业的业务流程需要跨越在多个业务系统中,随着业务的发展,经过长时间的系统运行,会伴随大量业务数据的产生,但数据标准的不一致、业务系统之间数据的不一致会直接影响信息的准确性以及一致性。
在现有技术中,对于数据问题依赖于事后的数据稽核,即对离线状态的数据进行稽核,通过该方式来帮助用户发现数据问题,确定目标业务数据中是否存在有异常数据。
可见,现有技术中存在对业务系统中数据稽核效果较差的问题。
发明内容
本发明实施例提供了一种数据稽核方法、装置、电子设备及存储介质,以解决现有技术中对数据稽核效果较差的问题。
第一方面,本发明实施例提供了一种数据稽核方法,包括:
获取数据流图库中的数据流图,所述数据流图包括如下至少一项:系统数据流图、系统库表结构图和系统部署图,所述系统数据流图包括系统间数据流图或业务线数据流图,所述系统库表结构图表示至少一个业务系统匹配数据库的数据表,所述系统部署图表示至少一个业务系统对应的硬软件部署图;
依据所述数据流图确定所述至少一个业务系统中的稽核目标,以及确定匹配所述稽核目标的预设稽核规则;
依据所述预设稽核规则对所述稽核目标进行数据稽核处理,得到数据稽核结果,所述数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果。
可选地,在所述获取至少一个业务系统匹配的数据流图之前,所述方法还包括:
获取第一操作信息,所述第一操作信息表示用户对基础元素的选择以及对基础元素设定位置的选择;
基于所述第一操作信息,获取第二操作信息,所述第二操作信息用于在所述基础元素之间添加对应稽核节点的元素,所述稽核节点用于配置稽核规则;
依据所述第一操作信息和所述第二操作信息创建第一数据流图,并将所述第一数据流图添加至所述数据流图库中;
其中,所述基础元素如下至少一项:节点、边和组,所述节点表示业务系统中的实体,所述边表示多个节点之间的关联,所述组表示相似节点的集合。
可选地,所述依据所述数据流图确定稽核目标和匹配所述稽核目标的预设稽核规则,包括如下至少一项:
在所述数据流图为所述系统间数据流图的情况下,将第一目标业务系统中的第一业务实体设定为所述稽核目标;将用户在所述第一业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述业务实体的存在性进行判断处理;
在所述数据流图为所述业务线数据流图的情况下,将第二目标业务系统中第二业务实体的属性设定为所述稽核目标;将用户在所述第二业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述第二业务实体的属性取值进行一致性判断处理;
在所述数据流图为所述系统库表结构图的情况下,将第三目标业务系统匹配数据库中的元数据信息设定为所述稽核目标;将用户设置的数据库稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述元数据信息的属性进行一致性判断处理;
在所述数据流图为所述系统部署图的情况下,将第四目标业务系统对应的硬软件构架设定为所述稽核目标;将用户设备的部署稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对软硬件执行情况进行判断处理;
其中,所述第一目标业务系统、所述第二目标业务系统、所述第三目标业务系统和所述第四目标业务系统为所述至少一个业务系统中的业务系统,所述第一业务实体为所述第一目标业务系统中的任意业务实体,所述第二业务实体为所述第二目标业务系统中的任意业务实体。
可选地,所述依据所述预设稽核规则对所述稽核目标进行数据稽核处理,生成数据稽核结果,包括如下至少一项:
在所述数据流图为所述系统库表结构图,且对所述元数据信息进行数据稽核处理的情况下,采集所述业务系统匹配数据库中的全量元数据,并对所述全量元数据进行一致性判定,得到第一数据稽核结果,所述第一数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
在所述数据流图为所述业务线数据流图,且对所述第二业务实体对应的实时数据进行数据稽核处理的情况下,采集多个业务系统之间的增量数据,将所述增量数据复制至内存数据库,采用预设稽核模型对所述内存数据库中的所述增量数据进行数据稽核处理,以得到第二数据稽核结果,所述第二数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
在所述数据流图为所述系统间数据流图或所述业务线数据流图,且对离线数据进行数据稽核处理的情况下,依据所述稽核规则确定检核脚本,所述检核脚本与所述稽核规则匹配对应,依据所述检核脚本查询所述业务系统匹配数据库的目标数据,并生成检核结果文件,依据所述检核结果文件生成第三数据稽核结果,所述第三数据稽核结果用于展示所述数据流图中的异常数据或分析结果。
可选地,所述第一数据稽核结果包括第一数据稽核子结果或第二数据稽核子结果;
在所述数据流图为所述系统库表结构图,且对所述元数据信息进行数据稽核处理的情况下,采集所述业务系统匹配数据库中的全量元数据并对所述全量元数据进行一致性判定,得到第一数据稽核结果,包括:
对所述全量元数据进行一致性判定,在所述全量元数据满足第一预设条件的情况下,生成所述第一数据稽核子结果,所述第一数据稽核子结果表示所述全量元数据中不包含异常数据;
在所述全量元数据不满足第一预设条件的情况下,生成所述第二数据稽核子结果,所述第二数据稽核子结果表示所述全量元数据中包含异常数据;
其中,所述第一预设条件表示所述全量元数据对应数据库表的目标属性与预设目标属性匹配,所述目标属性包括如下至少一项:数据库表结构、字段类型和字段长度。
可选地,在所述依据所述预设稽核规则对所述稽核目标进行数据稽核处理,生成数据稽核结果之后,所述方法还包括:
获取第三操作信息,所述第三操作信息表示用户对所述数据流图中所述稽核节点匹配的稽核规则进行修改;
依据所述第三操作信息更新所述数据流图。
第二方面,本发明实施例提供了一种数据稽核装置,包括:
第一获取模块,用于获取数据流图库中的数据流图,所述数据流图包括如下至少一项:系统数据流图、系统库表结构图和系统部署图,所述系统数据流图包括系统间数据流图或业务线数据流图,所述系统库表结构图表示至少一个业务系统匹配数据库的数据表,所述系统部署图表示至少一个业务系统对应的硬软件部署图;
确定模块,用于依据所述数据流图确定所述至少一个业务系统中的稽核目标,以及确定匹配所述稽核目标的预设稽核规则;
处理模块,用于依据所述预设稽核规则对所述稽核目标进行数据稽核处理,得到数据稽核结果,所述数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果。
可选地,所述装置还包括:
第二获取模块,用于获取第一操作信息,所述第一操作信息表示用户对基础元素的选择以及对基础元素设定位置的选择;
第三获取模块,用于基于所述第一操作信息,获取第二操作信息,所述第二操作信息用于在所述基础元素之间添加对应稽核节点的元素,所述稽核节点用于配置稽核规则;
创建模块,用于依据所述第一操作信息和所述第二操作信息创建第一数据流图,并将所述第一数据流图添加至所述数据流图库中;
其中,所述基础元素如下至少一项:节点、边和组,所述节点表示业务系统中的实体,所述边表示多个节点之间的关联,所述组表示相似节点的集合。
可选地,所述确定模块包括:
第一确定单元,用于在所述数据流图为所述系统间数据流图的情况下,将第一目标业务系统中的第一业务实体设定为所述稽核目标;将用户在所述第一业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述业务实体的存在性进行判断处理;
第二确定单元,用于在所述数据流图为所述业务线数据流图的情况下,将第二目标业务系统中第二业务实体的属性设定为所述稽核目标;将用户在所述第二业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述第二业务实体的属性取值进行一致性判断处理;
第三确定单元,用于在所述数据流图为所述系统库表结构图的情况下,将第三目标业务系统匹配数据库中的元数据信息设定为所述稽核目标;将用户设置的数据库稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述元数据信息的属性进行一致性判断处理;
第四确定单元,用于在所述数据流图为所述系统部署图的情况下,将第四目标业务系统对应的硬软件构架设定为所述稽核目标;将用户设备的部署稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对软硬件执行情况进行判断处理;
其中,所述第一目标业务系统、所述第二目标业务系统、所述第三目标业务系统和所述第四目标业务系统为所述至少一个业务系统中的业务系统,所述第一业务实体为所述第一目标业务系统中的任意业务实体,所述第二业务实体为所述第二目标业务系统中的任意业务实体。
可选地,所述处理模块包括:
第一处理单元,用于在所述数据流图为所述系统库表结构图,且对所述元数据信息进行数据稽核处理的情况下,采集所述业务系统匹配数据库中的全量元数据,并对所述全量元数据进行一致性判定,得到第一数据稽核结果,所述第一数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
第二处理单元,用于在所述数据流图为所述业务线数据流图,且对所述第二业务实体对应的实时数据进行数据稽核处理的情况下,采集多个业务系统之间的增量数据,将所述增量数据复制至内存数据库,采用预设稽核模型对所述内存数据库中的所述增量数据进行数据稽核处理,以得到第二数据稽核结果,所述第二数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
第三处理单元,用于在所述数据流图为所述系统间数据流图或所述业务线数据流图,且对离线数据进行数据稽核处理的情况下,依据所述稽核规则确定检核脚本,所述检核脚本与所述稽核规则匹配对应,依据所述检核脚本查询所述业务系统匹配数据库的目标数据,并生成检核结果文件,依据所述检核结果文件生成第三数据稽核结果,所述第三数据稽核结果用于展示所述数据流图中的异常数据或分析结果。
可选地,所述第一数据稽核结果包括第一数据稽核子结果或第二数据稽核子结果;
所述第一处理单元包括:
对所述全量元数据进行一致性判定,在所述全量元数据满足第一预设条件的情况下,生成所述第一数据稽核子结果,所述第一数据稽核子结果表示所述全量元数据中不包含异常数据;
在所述全量元数据不满足第一预设条件的情况下,生成所述第二数据稽核子结果,所述第二数据稽核子结果表示所述全量元数据中包含异常数据;
其中,所述第一预设条件表示所述全量元数据对应数据库表的目标属性与预设目标属性匹配,所述目标属性包括如下至少一项:数据库表结构、字段类型和字段长度。
可选地,所述装置还包括:
第四获取模块,用于获取第三操作信息,所述第三操作信息表示用户对所述数据流图中所述稽核节点匹配的稽核规则进行修改;
更新模块,用于依据所述第三操作信息更新所述数据流图。
第三方面,本发明实施例提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的数据稽核方法。
第四方面,本发明实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,包括:
所述计算机指令用于使所述计算机执行根据第一方面所述的数据稽核方法。
本发明实施例中,首先获取数据流图库中的数据流图,根据涉及的业务系统以及业务流程可以将数据流图分为系统数据流图、系统库表结构图和系统部署图,然后根据数据流图确定至少一个业务系统中的稽核目标,以及确定匹配稽核目标的预设稽核规则,最后根据匹配稽核目标的预设稽核规则对稽核目标进行数据稽核处理,并得到数据稽核结果,通过该方法,通过构建覆盖全业务流程的数据稽核体系实现对数据稽核事前、事中、事后各环节的监管,有效保证数据在业务链条上的完整性,提升数据稽核的质量,帮助用户及时发现数据问题,进而提高了数据稽核的效果。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种数据稽核方法的流程示意图;
图2是本发明实施例提供的一种数据稽核门户的示意图;
图3是本发明实施例提供的一种系统间数据流图的示意图;
图4是本发明实施例提供的一种业务线数据流图的示意图;
图5是本发明实施例提供的一种系统库表结构图的示意图;
图6是本发明实施例提供的一种系统部署拓扑图的示意图;
图7本发明实施例提供的一种数据稽核装置的结构示意图;
图8用来实现本发明实施例的数据稽核方法的电子设备的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参见图1,图1是本发明实施例提供的一种数据稽核方法的流程示意图,如图1所示,包括以下步骤:
步骤101、获取数据流图库中的数据流图,所述数据流图包括如下至少一项:系统数据流图、系统库表结构图和系统部署图,所述系统数据流图包括系统间数据流图或业务线数据流图,所述系统库表结构图表示至少一个业务系统匹配数据库的数据表,所述系统部署图表示至少一个业务系统对应的硬软件部署图;
步骤102、依据所述数据流图确定所述至少一个业务系统中的稽核目标,以及确定匹配所述稽核目标的预设稽核规则;
步骤103、依据所述预设稽核规则对所述稽核目标进行数据稽核处理,得到数据稽核结果,所述数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果。
其中,上述数据稽核方法所包括的步骤101、步骤102、步骤103以及步骤104可以是由电子计算机或是虚拟机等设备执行,对此本发明实施例不作限定。
并且,上述数据稽核方法中所涉及的数据库可以是任意用于存储数据的数据仓库,例如:Mysql、Oracle、Sqlserver以及Sqlite等数据库,对此本发明实施例也不作限定。
在步骤101中,上述数据流图库可以是储存有多个上述数据流图,其中,上述数据流图可以是由用户编辑创建生成,即本发明实施例提供的方法中可以配置图可视化引擎,从而提供对图的绘制、布局、分析、交互、动画等基础的图可视化能力,基于图可视化引擎可以帮助用户高效地创建上述数据流图。
需要说明的是,上述数据流图的构成元素可以是包括节点(Node)、边(Edge)和组(Combo),用户可以根据实际业务场景以及业务流程更改节点、边、组的配色和组合形式,从而创建更贴合业务场景或是业务系统的图可视分析应用,即上述数据流图。
另外,节点是构成图的基本单位,一般表示某个实体,在本发明实施例中的节点可以表示业务节点,边可以表示两个节点之间的关系,组可以理解为节点分组,用于管理一组相似的节点,如一组具有相同类型的节点,或位置上比较靠近的一组节点,可以将它们划分到同一个组中,从而有效降低对用户视觉上的干扰。
应理解,用户还可以基于上述数据流图创建数据稽核节点,即在上述数据流图中显示数据稽核节点,并且选择合适的稽核规则对数据进行检查,在一些可选的实施方式中,上述数据流图还可以是显示已创建稽核规则的数量以及缺失的稽核规则数量,从而供用户获取更多关于系统间数据稽核的信息。
在一些可选地实施方式中,用户可以采用如下交互方式完成对上述数据流图的绘制和创建:图可视化引擎可以配置相关交互样式,以供用户直接使用,例如点击节点、点击边、放缩画布以及拖拽画布等交互方法,其中,交互样式又可以分为点交互样式、边的交互样式和组的交互样式。
具体的,用户可以通过点击实体或关系,浏览下一级对应的数据流图,或者点击稽核规则数,查看对应的稽核规则。
上述数据流图包括如下至少一项:系统数据流图、系统库表结构图和系统部署图,系统数据流图、系统库表结构图和系统部署图可以理解为不同层次级别下的数据流图,例如:上述系统数据流图表示至少一个业务系统间的数据流向图,上述系统库表结构图表示至少一个业务系统匹配数据库的数据表,上述系统部署图表示至少一个业务系统对应的硬软件部署图,通过这种分层级的数据稽核体系,以上述数据流图为牵引,纵向穿透数据流向图、数据库表结构图、系统部署图,实现了端到端的数据稽核,提升了数据稽核的效果。
在步骤102中,依据上述数据流图确定上述至少一个业务系统中的稽核目标,以及确定匹配上述稽核目标的预设稽核规则,首先可以确定上述数据流图的类型,根据上述数据流图的类型确定上述稽核目标,也可以理解为稽核对象,因为上述预设稽核规则由用户预先设置,所以确定上述稽核目标后,可以根据用户设置的上述预设稽核规则进行数据稽核处理。
需要说明的是,上述预设稽核规则为用户在创建或是编辑上述数据流图时添加,上述预设稽核规则与上述稽核目标匹配,因此在本发明实施例中,上述预设稽核规则的具体规则以及上述预设稽核规则的数量不作限定。
在步骤103中,用户可以对业务系统事前、事中和事后进行数据稽核,其中,事前的数据稽核可以理解为对存储于数据库中的数据进行数据稽核,即对元数据的数据稽核处理,事中的数据稽核可以理解为对流式数据或是实时数据的数据稽核处理,事后的数据稽核可以理解为在数据入库后的数据稽核处理。
上述数据稽核结果可以是用于展示上述数据流图中的异常数据和/或分析结果,例如:用户对业务系统事前进行数据稽核后,得到的上述数据稽核结果可以表示为数据稽核报告,相关管理人员可以根据数据稽核报告对管理流程进行重新规范、整改,从而保证数据标准有效执行、落地;用户对业务系统事中进行数据稽核后,得到的上述数据稽核结果可以表示直接反馈至对应的业务系统,相关管理人员可以根据上述数据稽核结果对业务数据进行修正,另外,还可以对异常数据进行拦截处理,从而提高了稽核工作的效率和准确性;用户对业务系统事后进行数据稽核后,得到的上述数据稽核结果也以表示为数据稽核报告,该报告可以集中展示数据质量情况,相关管理人员可以根据数据质量情况进行对业务系统的改进,从而提高业务系统的数据稽核效果。
在该实施方案中,首先获取数据流图库中的数据流图,根据涉及的业务系统以及业务流程可以将数据流图分为系统数据流图、系统库表结构图和系统部署图,然后根据数据流图确定至少一个业务系统中的稽核目标,以及确定匹配稽核目标的预设稽核规则,最后根据匹配稽核目标的预设稽核规则对稽核目标进行数据稽核处理,并得到数据稽核结果,通过该方法,通过构建覆盖全业务流程的数据稽核体系实现对数据稽核事前、事中、事后各环节的监管,有效保证数据在业务链条上的完整性,提升数据稽核的质量,帮助用户及时发现数据问题,进而提高了数据稽核的效果。
另外,在本发明实施例中可以是设置供用户使用的交互模块,例如数据稽核门户,请参见图2,图2是数据稽核门户的示意图,数据稽核门户可以是以中台服务的方式开放上述数据流图编辑,以及对事前、事中和事后数据稽核的服务能力,即对元数据稽核、实时数据稽核、离线数据稽核的服务能力,程序接口实现服务的调用,面向各个层级提供多级稽核规则的管理、任务调度和稽核规则共享等,提供不同的数据稽核服务视图和能力,完成一站式的数据稽核服务。
其中,数据稽核门户将元数据稽核、实时数据稽核、离线数据稽核的配置和管理及数据标准集成在一个门户中,方便统一管理和维护,配置和管理包括系统管理、用户管理、角色管理、数据安全管理、系统参数配置等,通过对数据稽核门户的设置可以实现事前、事中以及事后数据稽核服务能力的整合,对元数据稽核、实时数据稽核和离线数据稽核进行统一配置和管理。
可选地,在所述获取至少一个业务系统匹配的数据流图之前,所述方法还包括:
获取第一操作信息,所述第一操作信息表示用户对基础元素的选择以及对基础元素设定位置的选择;
基于所述第一操作信息,获取第二操作信息,所述第二操作信息用于在所述基础元素之间添加对应稽核节点的元素,所述稽核节点用于配置稽核规则;
依据所述第一操作信息和所述第二操作信息创建第一数据流图,并将所述第一数据流图添加至所述数据流图库中;
其中,所述基础元素如下至少一项:节点、边和组,所述节点表示业务系统中的实体,所述边表示多个节点之间的关联,所述组表示相似节点的集合。
在该实施方案中,可以是首先获取用户的上述第一操作信息,上述第一操作信息可以理解为用户对系统框图的确定,因为上述第一操作信息表示用于对基础元素的选择以及对基础元素设定位置的选择,在系统框图确认之后再次获取用户的第二操作信息,上述第二操作信息表示用户在系统框图中添加预设的稽核规则,最后基于上述第一操作信息和上述第二操作信息创建上述第一数据流图,并且将上述第一数据流图添加至上述数据流图库中,通过该方法,用户可以根据业务系统的添加对数据流图进行创建,从而实现对全局业务系统的全过程管控,保证数据在业务链条上的完整性,提升数据的质量,能够帮助数据管理人员及时发现数据问题,进而提高了对业务系统数据稽核的效果。
需要说明的是,上述数据流图的构成元素可以是包括节点、边和组,用户可以根据实际业务场景以及业务流程更改节点、边、组的配色和组合形式,从而创建更贴合业务场景或是业务系统的图可视分析应用,即上述数据流图。
另外,节点是构成图的基本单位,一般表示某个实体,在本发明实施例中的节点可以表示业务节点,边可以表示两个节点之间的关系,组可以理解为节点分组,用于管理一组相似的节点,如一组具有相同类型的节点,或位置上比较靠近的一组节点,可以将它们划分到同一个组中,从而有效降低对用户视觉上的干扰。
可选地,所述依据所述数据流图确定稽核目标和匹配所述稽核目标的预设稽核规则,包括如下至少一项:
在所述数据流图为所述系统间数据流图的情况下,将第一目标业务系统中的第一业务实体设定为所述稽核目标;将用户在所述第一业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述业务实体的存在性进行判断处理;
在所述数据流图为所述业务线数据流图的情况下,将第二目标业务系统中第二业务实体的属性设定为所述稽核目标;将用户在所述第二业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述第二业务实体的属性取值进行一致性判断处理;
在所述数据流图为所述系统库表结构图的情况下,将第三目标业务系统匹配数据库中的元数据信息设定为所述稽核目标;将用户设置的数据库稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述元数据信息的属性进行一致性判断处理;
在所述数据流图为所述系统部署图的情况下,将第四目标业务系统对应的硬软件构架设定为所述稽核目标;将用户设备的部署稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对软硬件执行情况进行判断处理;
其中,所述第一目标业务系统、所述第二目标业务系统、所述第三目标业务系统和所述第四目标业务系统为所述至少一个业务系统中的业务系统,所述第一业务实体为所述第一目标业务系统中的任意业务实体,所述第二业务实体为所述第二目标业务系统中的任意业务实体。
在该实施方案中,根据上述数据流图类型的不同,从而确定上述数据流图中对应的上述稽核目标,以及上述稽核目标对应的上述预设稽核规则,应理解,上述数据流图是从数据传递以及加工角度,通过图形的方式来表示逻辑功能、业务数据在业务系统内部的逻辑流向以及逻辑变换的过程,通过该方法,以上述数据流图为牵引,纵向穿透数据流向图、数据库表结构图和系统部署图,实现了端到端的数据稽核,提升了业务系统的数据稽核效果及能力。
从前文实施例中可知,依据上述数据流图确定上述至少一个业务系统中的稽核目标,以及确定匹配上述稽核目标的预设稽核规则,在上述数据流图分别为上述系统间数据流图、业务线数据流图、系统库表结构图以及系统部署图的情况下,上述稽核目标以及对应的上述预设稽核规则是不相同的,请参见表1。
表1
层级 稽核关系 稽核对象
L1 系统间 系统间关键实体存在性保持一致(如站址、项目等)
L2 系统间/系统内 同一实体的关键属性取值保持一致(如金额、状态等)
L3 系统库表结构 同一实体、同一属性的元数据信息保持一致(如长度、精度等)
L4 全局 软硬件架构和系统部署合理性(如接口、副本等)
其中,上述数据流图可以分为L1、L 2、L 3以及L4四个层级,分别对应系统间数据流图、业务线数据流图、系统库表结构图以及系统部署拓扑图。
在上述数据流图为系统间数据流图的情况下,请参见图3,图3为本发明实施例提供的一种系统间数据流图的示意图,如图所示,图中的圆角矩形框表示各个业务系统,直角矩形框表示业务系统中的实体,设置在实体上的圆形表示已经创建的数据稽核规则,圆形里的数字表示已经创建的数据稽核规则的数量,而设置在实体上的菱形表示缺失的数据稽核规则,菱形里的数字表示缺失的数据稽核规则的数量。
其中,在此情况下上述数据流图表示为业务系统之间的数据稽核,例如:财务管理系统与资源资产系统之间的数据稽核示意图,财务管理系统与公共库之间的数据稽核示意图等,而在此层级中,稽核的对象则是各业务系统之间关键实体,上述预设稽核规则用于对所述业务实体的存在性进行判断处理。
在上述数据流图为业务线数据流图的情况下,请参见图4,图4为本发明实施例提供的一种业务线数据流图的示意图,如图所示,图中的封闭矩形表示业务流程节点,图中的非封闭矩形表示业务实体,图中的实线箭头表示业务流,图中的虚线箭头表示数据流,连接在业务实体之间的圆形表示已经创建的数据稽核规则,圆形里的数字表示已经创建的数据稽核规则的数量,而连接在业务实体之间的菱形表示缺失的数据稽核规则,菱形里的数字表示缺失的数据稽核规则的数量。
其中,财务管理系统和物业电费管理系统存在业务交互,且支付单(业务实体)在两个业务系统中共同存在的,那么用户可以在两个支付单之间设置数据稽核的操作,从而对支付单中对应的数据进行稽核,例如支付单的关键属性,检查取值是否保持一致。
在上述数据流图为系统库表结构图的情况下,请参见图5,图5为本发明实施例提供的一种系统库表结构图的示意图,如图所示,图5包括财务系统以及物业电费管理系统分别对应的数据库的信息。
其中,在此情况下上述数据流图表示为对财务系统以及物业电费管理系统对应数据库的数据稽核,具体为检查支付单在数据库中的元数据是否保持一致(如长度、精度等)。
在上述数据流图为系统部署拓扑图的情况下,请参见图6,图6为本发明实施例提供的一种系统部署拓扑图的示意图,如图所示有软件以及硬件的全局部署情况,在此情况下上述数据流图表示为依据上述预设稽核规则对软件以及硬件的部署合理性进行检查。
可选地,所述依据所述预设稽核规则对所述稽核目标进行数据稽核处理,生成数据稽核结果,包括如下至少一项:
在所述数据流图为所述系统库表结构图,且对所述元数据信息进行数据稽核处理的情况下,采集所述业务系统匹配数据库中的全量元数据,并对所述全量元数据进行一致性判定,得到第一数据稽核结果,所述第一数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
在所述数据流图为所述业务线数据流图,且对所述第二业务实体对应的实时数据进行数据稽核处理的情况下,采集多个业务系统之间的增量数据,将所述增量数据复制至内存数据库,采用预设稽核模型对所述内存数据库中的所述增量数据进行数据稽核处理,以得到第二数据稽核结果,所述第二数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
在所述数据流图为所述系统间数据流图或所述业务线数据流图,且对离线数据进行数据稽核处理的情况下,依据所述稽核规则确定检核脚本,所述检核脚本与所述稽核规则匹配对应,依据所述检核脚本查询所述业务系统匹配数据库的目标数据,并生成检核结果文件,依据所述检核结果文件生成第三数据稽核结果,所述第三数据稽核结果用于展示所述数据流图中的异常数据或分析结果。
本发明实施例主要包括对三种数据的稽核处理,分别为元数据稽核、实时数据稽核以及离线数据稽核,应理解,元数据稽核对应事前稽核,实时数据稽核对应事中稽核,离线数据稽核对应事后稽核,下面分别从这三个方面进行阐述:
(1)元数据稽核
元数据稽核主要依据字典标准,稽核各业务系统、数据仓库元数据信息的一致性,检查数据标准落地执行情况,最后生成上述第一数据稽核结果,即元数据稽核报告,从而提高各业务系统、数据仓库元数据质量。
首先,在多源异构环境下,通过采集适配器采集各业务系统和数据仓库的全量元数据,包括过程中的数据实体(系统、库、表、字段的描述)以及数据实体加工处理过程中的逻辑。采集适配器兼容不同格式的数据来源,对不同的数据库类型的数据字典信息进行转换以满足元数据采集要求,实现主流数据库数据字典(Excel)采集或联机直采。
对元数据进行采集之后,可以采用如下两种数据稽核的方式:一致性稽核和模型对比,其中,一致性稽核是对系统维护的对象(数据库表)的重点属性一致性进行稽核,如表结构是否一致、字段类型是否一致、字段长度是否一致等;模型对比是对比仓库维的元数据与实际业务库元数据之间的差异,如无数据字典、无实例对象、字段不一致等。
最后,得到上述第一数据稽核结果,相关管理人员可以基于上述第一数据稽核结果对管理流程进行规范,整改以及跟踪相关问题,从而保证数据标准有效落地。
(2)实时数据稽核
实时数据稽核可以理解为将信息通过采集器实时复制到独立的内存数据库中,通过实时稽核模型进行实时数据比对,实时拦截不合规的数据进入系统。
首先,通过采集器将多个异构业务系统数据实时复制到内存数据库,当业务系统中数据发生变化时,通过适配的采集器实时同步增量数据到内存数据库,实现对多个异构数据库实时采集的监控和维护。
需要说明的是,根据数据库类型的不同,采集数据的方式也有所不同,例如:1)MySQL数据采集
基于MySQL数据库,通过MySQL Binlog实时数据流,将数据实时复制到内存数据库,完成数据实时数据同步。通过将自己伪装成MySQL从节点(Slave),并从主节点(Master)获取Binlog的方法实时获得数据。
数据同步服务端负责连接至不同的MySQL实例,并为每个实例维护一个事件消息队列,实现数据实时同步。
在每个实例中配置一个备用MySQL,定期更新辅助表的心跳机制检测主库的存活,心跳机制是每分钟(可配置)对每个被抽取的表插入一条心跳数据并保存发送时间的机制,这个心跳表也被抽取,跟随着整个流程下来,与被同步表在实际上走相同的逻辑,当收到心跳包的时候,即便没有任何增删改的数据,也能证明整条链路是通的,可以在双Master场景下通过这个机制自动选择正在工作的数据源。
2)Oracle数据采集
基于Oracle数据库,通过SLT进行数据复制,通过客户端在源系统中创建日志表和触发器的方式获得数据。
接着,根据业务稽核场景,在内存数据库中固化数据稽核模型,例如:
①集中审核自动校验模型
将一体业务成立时由运营商固定资产割接而来产生的影响营收的历史数据问题由公司总部统一管理。其中,起租、维护扣罚、非包干油机发电费的操作等每月正常业务行为由分公司自行操作;服务终止、调账统一上收至总部集中操作;业务变更(含追溯)操作根据操作频繁程度和对营收影响程度实行分类管理,不同数据分类授权不同层级业务支撑部及专业部门审核把关后集中操作。将集中审核设计独立于生产流程的分级稽核体系,通过实时同步各系统中集中审核所需信息进行批量或逐单自动稽核并反馈原因,减轻人工审核的工作,并提高集中操作审核效率。
②销售订单批量绑定资源稽核模型
销售订单编制和起租时无法判断客户关系管理系统(Customer relationshipmanagement system,CRM)中的产品与资源系统中对应站址的铁塔、机房资源规格是否匹配,因而可能出现销售品类型错误引发费用争议。实际操作过程中无法对订单进行批量绑定并查询资源相符情况。通过调用实时稽核服务进行校验,协助用户批量操作并完成相符性检查,避免事后发现导致一系列变更。
③退租订单在途业务稽核模型
客户经理发起因拆站或其他原因导致的订单退租时,由于物业系统和销售系统间缺乏数据交互,导致操作人员无法及时掌握该订单是否还有相关服务及费用是否完成调整,一旦单方面退租,将导致该站址收支不匹配。利用稽核模型实时同步物业系统及销售系统数据并校验订单对应站址相关的在途服务和费用信息,实时提醒客户经理协调发起相关业务办结或转移。
④采购到付款流程中三类关键单据稽核模型
物资采购入库时入库单和采购订单无比对,付款时结算单和采购订单也无比对,不验证项目状态和付款比例,操作人员在工程项目付款时无验证,易造成实物管理和支付的风险。通过调用实时稽核服务实时检查采购订单和入库单、采购订单和结算单以及付款比例的相符性,实时提醒操作者及时修正。
通过实时数据稽核模型对业务数据进行检查,生成上述第二数据稽核结果,并实时将异常数据和稽核结果反馈给各业务系统,相关管理人员对业务数据进行修正,提高稽核工作的效率和准确性。
应理解,将基于流式计算的实时稽核能力嵌入各业务流程中,在对异常业务数据拦截提示的同时,统计异常数据拦截比率,形成各业务点的警示灯。当拦截率达到比率时向用户进行示警,有利于业务部门发现各环节风险及问题并及时处理,最大程度减少异常数据到来的损失。
(3)离线数据稽核
离线数据稽核可以理解为遵照完整性、唯一性、及时性、有效性、准确性、一致性这六个维度固化数据稽核规则,通过定时任务完成数据稽核,发现各业务系统、数据仓库中的数据质量问题并进行整改。
在用户创建离线数据稽核规则,并开始进行数据稽核时,依次执行各个检核方法,检核方法的执行实际上就是其检核脚本的执行。这些检核方法如果有查询出的数据便会在Receive目录中生成其对应的检核结果文件(DAT文件),同时生成一个同名的XML文件,作为结果文件到达的就绪标识。所有这些文件会存放在Receive目录中的以此次任务的检核日期为名称的文件夹中。
稽核结果采集程序使用Quartz作业的方式进行轮询采集,由于每次需要采集的文件数量不同,所包含的数据量也不同,再加之其他因素的可能性干扰,所以每一次作业所使用的时间不会相同,这样就会使得每一次作业启动时上一次作业未必已经结束。为了避免不同作业批次之间的资源争用问题,系统采用单作业执行的方式,如果作业启动时上一次作业还没有结束,则本次作业自动结束,直到上次作业结束才启动下一次作业。
稽核结果采集模块将检核结果文件采集入库,在采集过程中对这些检核结果数据进行简单的汇总操作,并将明细数据和汇总数据分别存入结果明细表和汇总表。此过程中如果发生了异常则对数据库表进行回滚操作,以避免出现不完整的数据,然后将此文件移至Error目录。
需要说明的是,用户可以是针对不同的业务实体依据稽核类别定义出稽核规则,每一个稽核规则都是从业务实体的角度上对质量问题进行简单的描述,都包含一个或多个信息项,这些信息项就是每一个业务实体具体所要稽核的对象,这样我们就在每一个稽核规则的基础上根据不同的信息项定义出具体的稽核方法。
在该实施方案中,根据上述数据流图类型的不同,从而确定上述数据流图中对应的上述稽核目标,以及上述稽核目标对应的上述预设稽核规则,通过该方法,以上述数据流图为牵引,纵向穿透数据流向图、数据库表结构图和系统部署图,实现了端到端的数据稽核,提升了业务系统的数据稽核效果及能力。
可选地,所述第一数据稽核结果包括第一数据稽核子结果或第二数据稽核子结果;
在所述数据流图为所述系统库表结构图,且对所述元数据信息进行数据稽核处理的情况下,采集所述业务系统匹配数据库中的全量元数据并对所述全量元数据进行一致性判定,得到第一数据稽核结果,包括:
对所述全量元数据进行一致性判定,在所述全量元数据满足第一预设条件的情况下,生成所述第一数据稽核子结果,所述第一数据稽核子结果表示所述全量元数据中不包含异常数据;
在所述全量元数据不满足第一预设条件的情况下,生成所述第二数据稽核子结果,所述第二数据稽核子结果表示所述全量元数据中包含异常数据;
其中,所述第一预设条件表示所述全量元数据对应数据库表的目标属性与预设目标属性匹配,所述目标属性包括如下至少一项:数据库表结构、字段类型和字段长度。
在该实施方案中,采用一致性稽核对业务系统维护的对象(数据库表)的重点属性的一致性进行稽核,如表结构是否一致、字段类型是否一致、字段长度是否一致等属性判断,通过该方法,可以提高对元数据稽核的准确性,另一方面,通过检查数据标准落地执行情况,生成所述第一数据稽核子结果或是上述第二数据稽核子结果,进而提高各业务系统和数据仓库元数据质量。
需要说明的是,相关人员可以根据上述第二数据稽核子结果对业务系统进行整改,对异常数据进行跟踪及修改,以此来保证数据标准的有效落地。
可选地,在所述依据所述预设稽核规则对所述稽核目标进行数据稽核处理,生成数据稽核结果之后,所述方法还包括:
获取第三操作信息,所述第三操作信息表示用户对所述数据流图中所述稽核节点匹配的稽核规则进行修改;
依据所述第三操作信息更新所述数据流图。
在该实施方案中,获取用户的上述第三操作信息,上述第三操作信息可以理解为用户对上述数据流图库中的数据流图进行的修改操作,在业务系统运行环境或是数据发生变化的情况下,需要对稽核规则进行替换或是修改,通过该方法,提高了对业务系统数据稽核的稳定性。
需要说明的是,若是业务系统中的业务流程发生变动,用户可以通过上述第三操作信息对数据流图中业务实体对应的基础元素进行修改,对此本发明实施例不作限定。
请参见图7,图7是本发明实施例提供的一种数据稽核装置的结构示意图,如图7所示,数据稽核装置700包括:
第一获取模块701,用于获取数据流图库中的数据流图,所述数据流图包括如下至少一项:系统数据流图、系统库表结构图和系统部署图,所述系统数据流图包括系统间数据流图或业务线数据流图,所述系统库表结构图表示至少一个业务系统匹配数据库的数据表,所述系统部署图表示至少一个业务系统对应的硬软件部署图;
确定模块702,用于依据所述数据流图确定所述至少一个业务系统中的稽核目标,以及确定匹配所述稽核目标的预设稽核规则;
处理模块703,用于依据所述预设稽核规则对所述稽核目标进行数据稽核处理,得到数据稽核结果,所述数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果。
可选地,装置700还包括:
第二获取模块,用于获取第一操作信息,所述第一操作信息表示用户对基础元素的选择以及对基础元素设定位置的选择;
第三获取模块,用于基于所述第一操作信息,获取第二操作信息,所述第二操作信息用于在所述基础元素之间添加对应稽核节点的元素,所述稽核节点用于配置稽核规则;
创建模块,用于依据所述第一操作信息和所述第二操作信息创建第一数据流图,并将所述第一数据流图添加至所述数据流图库中;
其中,所述基础元素如下至少一项:节点、边和组,所述节点表示业务系统中的实体,所述边表示多个节点之间的关联,所述组表示相似节点的集合。
可选地,确定模块702包括:
第一确定单元,用于在所述数据流图为所述系统间数据流图的情况下,将第一目标业务系统中的第一业务实体设定为所述稽核目标;将用户在所述第一业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述业务实体的存在性进行判断处理;
第二确定单元,用于在所述数据流图为所述业务线数据流图的情况下,将第二目标业务系统中第二业务实体的属性设定为所述稽核目标;将用户在所述第二业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述第二业务实体的属性取值进行一致性判断处理;
第三确定单元,用于在所述数据流图为所述系统库表结构图的情况下,将第三目标业务系统匹配数据库中的元数据信息设定为所述稽核目标;将用户设置的数据库稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述元数据信息的属性进行一致性判断处理;
第四确定单元,用于在所述数据流图为所述系统部署图的情况下,将第四目标业务系统对应的硬软件构架设定为所述稽核目标;将用户设备的部署稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对软硬件执行情况进行判断处理;
其中,所述第一目标业务系统、所述第二目标业务系统、所述第三目标业务系统和所述第四目标业务系统为所述至少一个业务系统中的业务系统,所述第一业务实体为所述第一目标业务系统中的任意业务实体,所述第二业务实体为所述第二目标业务系统中的任意业务实体。
可选地,处理模块703包括:
第一处理单元,用于在所述数据流图为所述系统库表结构图,且对所述元数据信息进行数据稽核处理的情况下,采集所述业务系统匹配数据库中的全量元数据,并对所述全量元数据进行一致性判定,得到第一数据稽核结果,所述第一数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
第二处理单元,用于在所述数据流图为所述业务线数据流图,且对所述第二业务实体对应的实时数据进行数据稽核处理的情况下,采集多个业务系统之间的增量数据,将所述增量数据复制至内存数据库,采用预设稽核模型对所述内存数据库中的所述增量数据进行数据稽核处理,以得到第二数据稽核结果,所述第二数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
第三处理单元,用于在所述数据流图为所述系统间数据流图或所述业务线数据流图,且对离线数据进行数据稽核处理的情况下,依据所述稽核规则确定检核脚本,所述检核脚本与所述稽核规则匹配对应,依据所述检核脚本查询所述业务系统匹配数据库的目标数据,并生成检核结果文件,依据所述检核结果文件生成第三数据稽核结果,所述第三数据稽核结果用于展示所述数据流图中的异常数据或分析结果。
可选地,所述第一数据稽核结果包括第一数据稽核子结果或第二数据稽核子结果;
所述第一处理单元包括:
对所述全量元数据进行一致性判定,在所述全量元数据满足第一预设条件的情况下,生成所述第一数据稽核子结果,所述第一数据稽核子结果表示所述全量元数据中不包含异常数据;
在所述全量元数据不满足第一预设条件的情况下,生成所述第二数据稽核子结果,所述第二数据稽核子结果表示所述全量元数据中包含异常数据;
其中,所述第一预设条件表示所述全量元数据对应数据库表的目标属性与预设目标属性匹配,所述目标属性包括如下至少一项:数据库表结构、字段类型和字段长度。
可选地,装置700还包括:
第四获取模块,用于获取第三操作信息,所述第三操作信息表示用户对所述数据流图中所述稽核节点匹配的稽核规则进行修改;
更新模块,用于依据所述第三操作信息更新所述数据流图。
根据本发明的实施例,本发明还提供了一种电子设备、一种可读存储介质。
图8示出了可以用来实施本发明实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(Read-OnlyMemory,ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RandomAccess Memory,RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/Output,I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(Central processing unit,CPU)、图形处理单元(Graphics processing unit,GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如数据稽核方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(Field Programmable Gate Array,FPGA)、专用集成电路(Application Specific Integrated Circuit,ASIC)、专用标准产品(ApplicationSpecific Standard Parts,ASSP)、芯片上系统(System on Chip,SOC)、复杂可编程逻辑设备(Complex Programmable logic device,CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(计算机存储器(Erasable Programmable Read-Only Memory,EPROM)或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置;以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网、广域网和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种数据稽核方法,其特征在于,包括:
获取数据流图库中的数据流图,所述数据流图包括如下至少一项:系统数据流图、系统库表结构图和系统部署图,所述系统数据流图包括系统间数据流图或业务线数据流图,所述系统库表结构图表示至少一个业务系统匹配数据库的数据表,所述系统部署图表示至少一个业务系统对应的硬软件部署图;
依据所述数据流图确定所述至少一个业务系统中的稽核目标,以及确定匹配所述稽核目标的预设稽核规则;
依据所述预设稽核规则对所述稽核目标进行数据稽核处理,得到数据稽核结果,所述数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果。
2.根据权利要求1所述的数据稽核方法,其特征在于,在所述获取至少一个业务系统匹配的数据流图之前,所述方法还包括:
获取第一操作信息,所述第一操作信息表示用户对基础元素的选择以及对基础元素设定位置的选择;
基于所述第一操作信息,获取第二操作信息,所述第二操作信息用于在所述基础元素之间添加对应稽核节点的元素,所述稽核节点用于配置稽核规则;
依据所述第一操作信息和所述第二操作信息创建第一数据流图,并将所述第一数据流图添加至所述数据流图库中;
其中,所述基础元素如下至少一项:节点、边和组,所述节点表示业务系统中的实体,所述边表示多个节点之间的关联,所述组表示相似节点的集合。
3.根据权利要求2所述的数据稽核方法,其特征在于,所述依据所述数据流图确定稽核目标和匹配所述稽核目标的预设稽核规则,包括如下至少一项:
在所述数据流图为所述系统间数据流图的情况下,将第一目标业务系统中的第一业务实体设定为所述稽核目标;将用户在所述第一业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述业务实体的存在性进行判断处理;
在所述数据流图为所述业务线数据流图的情况下,将第二目标业务系统中第二业务实体的属性设定为所述稽核目标;将用户在所述第二业务实体配置的稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述第二业务实体的属性取值进行一致性判断处理;
在所述数据流图为所述系统库表结构图的情况下,将第三目标业务系统匹配数据库中的元数据信息设定为所述稽核目标;将用户设置的数据库稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对所述元数据信息的属性进行一致性判断处理;
在所述数据流图为所述系统部署图的情况下,将第四目标业务系统对应的硬软件构架设定为所述稽核目标;将用户设备的部署稽核规则设定为所述预设稽核规则,所述预设稽核规则用于对软硬件执行情况进行判断处理;
其中,所述第一目标业务系统、所述第二目标业务系统、所述第三目标业务系统和所述第四目标业务系统为所述至少一个业务系统中的业务系统,所述第一业务实体为所述第一目标业务系统中的任意业务实体,所述第二业务实体为所述第二目标业务系统中的任意业务实体。
4.根据权利要求3所述的数据稽核方法,其特征在于,所述依据所述预设稽核规则对所述稽核目标进行数据稽核处理,生成数据稽核结果,包括如下至少一项:
在所述数据流图为所述系统库表结构图,且对所述元数据信息进行数据稽核处理的情况下,采集所述业务系统匹配数据库中的全量元数据,并对所述全量元数据进行一致性判定,得到第一数据稽核结果,所述第一数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
在所述数据流图为所述业务线数据流图,且对所述第二业务实体对应的实时数据进行数据稽核处理的情况下,采集多个业务系统之间的增量数据,将所述增量数据复制至内存数据库,采用预设稽核模型对所述内存数据库中的所述增量数据进行数据稽核处理,以得到第二数据稽核结果,所述第二数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果;
在所述数据流图为所述系统间数据流图或所述业务线数据流图,且对离线数据进行数据稽核处理的情况下,依据所述稽核规则确定检核脚本,所述检核脚本与所述稽核规则匹配对应,依据所述检核脚本查询所述业务系统匹配数据库的目标数据,并生成检核结果文件,依据所述检核结果文件生成第三数据稽核结果,所述第三数据稽核结果用于展示所述数据流图中的异常数据或分析结果。
5.根据权利要求4所述的数据稽核方法,其特征在于,所述第一数据稽核结果包括第一数据稽核子结果或第二数据稽核子结果;
在所述数据流图为所述系统库表结构图,且对所述元数据信息进行数据稽核处理的情况下,采集所述业务系统匹配数据库中的全量元数据并对所述全量元数据进行一致性判定,得到第一数据稽核结果,包括:
对所述全量元数据进行一致性判定,在所述全量元数据满足第一预设条件的情况下,生成所述第一数据稽核子结果,所述第一数据稽核子结果表示所述全量元数据中不包含异常数据;
在所述全量元数据不满足第一预设条件的情况下,生成所述第二数据稽核子结果,所述第二数据稽核子结果表示所述全量元数据中包含异常数据;
其中,所述第一预设条件表示所述全量元数据对应数据库表的目标属性与预设目标属性匹配,所述目标属性包括如下至少一项:数据库表结构、字段类型和字段长度。
6.根据权利要求1至5任一项所述的数据稽核方法,其特征在于,在所述依据所述预设稽核规则对所述稽核目标进行数据稽核处理,生成数据稽核结果之后,所述方法还包括:
获取第三操作信息,所述第三操作信息表示用户对所述数据流图中所述稽核节点匹配的稽核规则进行修改;
依据所述第三操作信息更新所述数据流图。
7.一种数据稽核装置,其特征在于,包括:
第一获取模块,用于获取数据流图库中的数据流图,所述数据流图包括如下至少一项:系统数据流图、系统库表结构图和系统部署图,所述系统数据流图包括系统间数据流图或业务线数据流图,所述系统库表结构图表示至少一个业务系统匹配数据库的数据表,所述系统部署图表示至少一个业务系统对应的硬软件部署图;
确定模块,用于依据所述数据流图确定所述至少一个业务系统中的稽核目标,以及确定匹配所述稽核目标的预设稽核规则;
处理模块,用于依据所述预设稽核规则对所述稽核目标进行数据稽核处理,得到数据稽核结果,所述数据稽核结果用于展示所述数据流图中的异常数据和/或分析结果。
8.根据权利要求7所述的数据稽核装置,其特征在于,所述装置还包括:
第二获取模块,用于获取第一操作信息,所述第一操作信息表示用户对基础元素的选择以及对基础元素设定位置的选择;
第三获取模块,用于基于所述第一操作信息,获取第二操作信息,所述第二操作信息用于在所述基础元素之间添加对应稽核节点的元素,所述稽核节点用于配置稽核规则;
创建模块,用于依据所述第一操作信息和所述第二操作信息创建第一数据流图,并将所述第一数据流图添加至所述数据流图库中;
其中,所述基础元素如下至少一项:节点、边和组,所述节点表示业务系统中的实体,所述边表示多个节点之间的关联,所述组表示相似节点的集合。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6中任一项所述的数据稽核方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1至6中任一项所述的数据稽核方法。
CN202310140103.7A 2023-02-13 2023-02-13 一种数据稽核方法、装置、电子设备及存储介质 Pending CN116303385A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310140103.7A CN116303385A (zh) 2023-02-13 2023-02-13 一种数据稽核方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310140103.7A CN116303385A (zh) 2023-02-13 2023-02-13 一种数据稽核方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116303385A true CN116303385A (zh) 2023-06-23

Family

ID=86802318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310140103.7A Pending CN116303385A (zh) 2023-02-13 2023-02-13 一种数据稽核方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116303385A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116701381A (zh) * 2023-08-03 2023-09-05 南京莫愁智慧信息科技有限公司 一种分布式数据采集入库用的多级校验系统及校验方法
CN117312314A (zh) * 2023-09-26 2023-12-29 广州加之科技有限公司 一种医院业务数据全面稽核管理方法、装置、终端及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116701381A (zh) * 2023-08-03 2023-09-05 南京莫愁智慧信息科技有限公司 一种分布式数据采集入库用的多级校验系统及校验方法
CN116701381B (zh) * 2023-08-03 2023-11-03 南京莫愁智慧信息科技有限公司 一种分布式数据采集入库用的多级校验系统及校验方法
CN117312314A (zh) * 2023-09-26 2023-12-29 广州加之科技有限公司 一种医院业务数据全面稽核管理方法、装置、终端及介质

Similar Documents

Publication Publication Date Title
CN112396404A (zh) 一种数据中台系统
US8340995B2 (en) Method and system of using artifacts to identify elements of a component business model
CN102117306B (zh) Etl数据处理过程的监控方法及其系统
CN112395325A (zh) 一种数据治理方法、系统、终端设备及存储介质
WO2012167267A2 (en) Building information tracking system and method of use
CN116303385A (zh) 一种数据稽核方法、装置、电子设备及存储介质
CN115470195A (zh) 一种融合维度模型的指标数据自动化计算方法及装置
US20140229223A1 (en) Integrated erp based planning
CN114880405A (zh) 一种基于数据湖的数据处理方法及系统
WO2024060725A1 (zh) 一种飞机工装变更方法、装置、设备及存储介质
CN109214776A (zh) 一种火电epc工程总承包管理全过程全要素管控平台
CN113722564A (zh) 基于空间图卷积能源物资供应链的可视化方法及装置
CN111143391A (zh) 一种数据共享交换方法及系统
CN114037304B (zh) 一种成本资料的数据归集方法、设备及介质
CN114255073B (zh) 一种基于数据中台的营销普查方法
CN108199862A (zh) 一种业务系统报错管理系统及方法
US20140149186A1 (en) Method and system of using artifacts to identify elements of a component business model
CN109947797B (zh) 一种数据检查装置及方法
JP6063235B2 (ja) 作業自動化支援システム及び作業自動化支援方法
CN111882294B (zh) 一种流程审批的方法和装置
NOVIKOV et al. Improving the enterprise resource planning system based on digital modules of the industry 4.0 concept
CN112907220A (zh) 一种工程造价的系统、方法及装置
CN107590269A (zh) 一种数据仓库中创建立方模型的方法、设备及存储设备
CN117520163A (zh) 应用系统的管理方法、装置、存储介质及电子装置
CN114862180B (zh) 一种基于全生命周期的产品质量数据分析反馈方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination