[go: up one dir, main page]

CN111209325A - 业务系统接口识别方法、装置及存储介质 - Google Patents

业务系统接口识别方法、装置及存储介质 Download PDF

Info

Publication number
CN111209325A
CN111209325A CN201911425810.0A CN201911425810A CN111209325A CN 111209325 A CN111209325 A CN 111209325A CN 201911425810 A CN201911425810 A CN 201911425810A CN 111209325 A CN111209325 A CN 111209325A
Authority
CN
China
Prior art keywords
data
interface
type
service system
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911425810.0A
Other languages
English (en)
Other versions
CN111209325B (zh
Inventor
刘垚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN201911425810.0A priority Critical patent/CN111209325B/zh
Publication of CN111209325A publication Critical patent/CN111209325A/zh
Application granted granted Critical
Publication of CN111209325B publication Critical patent/CN111209325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种业务系统接口识别方法,所述方法包括以下步骤:确定业务系统产生的请求响应数据间的关联度数据;根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上;将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输。本发明还公开了一种业务系统接口识别装置及计算机可读存储介质。通过将关联度高于关联度阈值的业务接口划分为同一个数据接口,提高了业务系统的接口识别与接口管理的效率与效果。

Description

业务系统接口识别方法、装置及存储介质
技术领域
本发明涉及网络管理技术领域,尤其涉及一种业务系统接口识别方法、业务系统接口识别装置及计算机可读存储介质。
背景技术
无论是部署在内网或外网业务系统,管理者想知道哪些用户访问了哪些业务接口,哪些接口涉及哪些重要或敏感数据,就需要对不同的业务接口进行配置。而在具体的使用环境中,网络中可能有多个业务系统且有的业务系统有上百个接口,此时,让管理者手动去配置每个接口显然不太现实,不仅工作量大,耗时耗力,而且容易出错;并且在接口较多时,业务系统对于接收到的数据请求进行接口识别需要很耗费大量的识别时间,且识别过程容易出现误识别。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明主要目的在于提供一种业务系统接口识别方法、业务系统接口识别装置及计算机可读存储介质,旨在解决现有技术中业务系统接口识别的识别效率低不利于管理的问题。
为实现上述目的,本发明提供一种业务系统接口识别方法,所述方法包括以下步骤:
确定业务系统产生的请求响应数据间的关联度数据;
根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上;
将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输。
可选地,所述确定业务系统产生的请求响应数据间的关联度数据的步骤包括:
获取业务系统产生的请求响应数据的数据类型,确定与每个数据类型对应的关联度提取器;
运用每个数据类型对应的关联度提取器确定每个数据类型的请求响应数据间的关联度数据。
可选地,所述获取业务系统产生的请求响应数据的数据类型,确定与每个数据类型对应的关联度提取器的步骤包括:
若所述数据类型为第一数据类型,则确定与所述第一数据类型相应的关联度提取器为第一关联度提取器;
若所述数据类型为第二数据类型,则确定与所述第二数据类型相应的关联度提取器为第二关联度提取器;
若所述数据类型为第三数据类型,则确定与所述第三数据类型相应的关联度提取器为第三关联度提取器;其中,所述第一数据类型为html数据类型,所述第二数据类型为json数据类型,所述json数据类型包括:xml格式与xxx-urlencoded-form格式及json格式对应的数据类型,所述第三数据类型为除第一数据类型与第二数据类型外的其他数据类型。
可选地,所述运用每个数据类型对应的关联度提取器确定每个数据类型的请求响应数据间的关联度数据的步骤包括:
若所述数据类型为第一数据类型,则运用第一关联度提取器求取第一数据类型的请求响应数据的风格关联度、结构关联度及显示内容关联度的加权平均值,将所述加权平均值确定为第一数据类型的目标数据的关联度数据;
若所述数据类型为第二数据类型,则将去值留键后的请求响应按键的按键名及结构类型作为匹配条件,利用第二关联度提取器计算所述匹配条件被匹配上的匹配次数,根据所述匹配次数确定第二数据类型的目标数据的关联度数据;
若所述数据类型为第三数据类型,则利用第三关联度提取器提取第三数据类型的目标数据的指纹信息,根据所述指纹信息确定第三数据类型的目标数据的关联度数据。
可选地,所述根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上的步骤包括:
根据所述关联度数据确定每个数据类型的请求响应数据间的关联度;
判断每个数据类型的请求响应数据间的关联度是否超过对应的关联度阈值;
若超过,则确定关联度超过对应的关联度阈值的关联数据及与所述关联数据对应的关联数据类型,将所述关联数据确定为所述关联数据类型对应的目标数据。
可选地,所述将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输的步骤之后,还包括:
根据所述目标数据的分类参数对划分后的数据接口进行分类,将所述划分后的数据接口分为不同类别的数据接口,以在目标数据请求时从相应类别的数据接口进行数据传输;所述分类参数包括:请求类型、返回类型、请求方式、访问信息、网址路径深度、请求关联度及响应关联度。
可选地,所述将所述划分后的数据接口分为不同类别的数据接口,以在目标数据请求时从相应类别的数据接口进行数据传输的步骤包括:
获取分类后每一类数据接口对应的目标数据的特征信息,将所述特征信息作为与每一类数据接口对应的接口信息;
根据所述接口信息定义每一类数据接口,以在目标数据请求时,根据每一类数据接口的定义从相应类别的数据接口进行数据传输。
可选地,所述将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输的步骤之后,还包括:
根据目标数据的数据头源地址字段及目标数据响应体中的超链接,构建各个业务系统接口间的父子关系;
基于所述父子关系生成业务系统的接口关系树,基于所述接口关系树进行业务系统接口的层级关系识别。
此外,为实现上述目的,本发明还提供一种业务系统接口识别装置,所述业务系统接口识别装置包括存储器、处理器及存储在所述处理器上并可在处理器上运行的业务系统接口识别程序,所述处理器执行所述业务系统接口识别程序时实现如上所述业务系统接口识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有业务系统接口识别程序,所述业务系统接口识别程序被处理器执行时实现如上所述的业务系统接口识别方法的步骤。
本发明实施例中,通过确定业务系统产生的请求响应数据间的关联度数据,根据所述关联度数据确定目标数据,并将所述目标数据的业务接口划分为同一个数据接口,以在接收到与所述目标数据相应的上传或下载请求时,从所述目标数据对应的同一个接口进行进行数据传输,将关联度超过关联度阈值的业务接口归类到同一个业务接口减少了接口的数量,可以减少接口识别的时间与接口管理时间,更有利于进行接口识别与接口管理,从而提高接口识别与管理的效率与效果。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的业务系统接口识别装置结构示意图;
图2是本发明业务系统接口识别方法第一实施例的流程示意图;
图3为本发明业务系统接口识别方法一具体应用实施例的应用场景图;
图4是本发明业务系统接口识别方法一较优的实施例中确定业务系统产生的请求响应数据间的关联度数据的细化流程示意图;
图5是本发明业务系统接口识别方法一较优的实施例中根据所述关联度数据确定目标数据的细化流程示意图;
图6为本发明业务系统接口识别方法第二实施例的流程示意图;
图7为本发明业务系统接口识别方法第三实施例的流程示意图。
图8是本发明业务系统接口识别方法一实施例中建立业务系统个接口关系树形图的流程示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的主要解决方案是:确定业务系统产生的请求响应数据间的关联度数据;根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上;将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输。
由于目前的业务系统接口识别方法在业务系统的接口过多时,存在接口识别难度大、效率低且不利于管理者根据接口信息对业务系统进行管理等问题。因而,本发明提出一种业务系统接口识别方法、业务系统接口识别装置及计算机可读存储介质,通过确定业务系统产生的不同数据类型的请求响应数据间的关联度数据,根据所述关联度数据确定每个数据类型的请求响应数据对应的目标数据,将关联度高于关联度阈值的目标数据对应的业务接口归类到同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输,有利于根据归类后的数据接口识别不同类型的数据请求对应的数据接口,且便于管理者通过归类后的接口进行业务系统的分析与管理,提高了接口识别与管理的效率。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的业务系统接口识别装置结构示意图。
如图1所示,该业务系统接口识别装置可以包括:通信总线1002,处理器1001,例如CPU,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的业务系统接口识别装置结构并不构成对业务系统接口识别装置的限定,可以包括比图示更多或更少的部件,或组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及业务系统接口识别程序。
在图1所示的业务系统接口识别装置中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的业务系统接口识别程序,并执行以下操作:
确定业务系统产生的请求响应数据间的关联度数据;
根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上;
将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输。
可选地,处理器1001可以调用存储器1005中存储的业务系统接口识别程序,还执行以下操作:
获取业务系统产生的请求响应数据的数据类型,确定与每个数据类型对应的关联度提取器;
运用每个数据类型对应的关联度提取器确定每个数据类型的请求响应数据间的关联度数据。
可选地,处理器1001可以调用存储器1005中存储的业务系统接口识别程序,还执行以下操作:
若所述数据类型为第一数据类型,则确定与所述第一数据类型相应的关联度提取器为第一关联度提取器;
若所述数据类型为第二数据类型,则确定与所述第二数据类型相应的关联度提取器为第二关联度提取器;
若所述数据类型为第三数据类型,则确定与所述第三数据类型相应的关联度提取器为第三关联度提取器;其中,所述第一数据类型为html数据类型,所述第二数据类型为json数据类型,所述json数据类型包括:xml格式与xxx-urlencoded-form格式及json格式对应的数据类型,所述第三数据类型为除第一数据类型与第二数据类型外的其他数据类型。
可选地,处理器1001调用存储器1005中存储的业务系统接口识别程序,并执行以下操作:
若所述数据类型为第一数据类型,则运用第一关联度提取器求取第一数据类型的请求响应数据的风格关联度、结构关联度及显示内容关联度的加权平均值,将所述加权平均值确定为第一数据类型的目标数据的关联度数据;
若所述数据类型为第二数据类型,则将去值留键后的请求响应按键的按键名及结构类型作为匹配条件,利用第二关联度提取器计算所述匹配条件被匹配上的匹配次数,根据所述匹配次数确定第二数据类型的目标数据的关联度数据;
若所述数据类型为第三数据类型,则利用第三关联度提取器提取第三数据类型的目标数据的指纹信息,根据所述指纹信息确定第三数据类型的目标数据的关联度数据。
可选地,处理器1001可以调用存储器1005中存储的业务系统接口识别程序,还执行以下操作:
根据所述关联度数据确定每个数据类型的请求响应数据间的关联度;
判断每个数据类型的请求响应数据间的关联度是否超过对应的关联度阈值;
若超过,则确定关联度超过对应的关联度阈值的关联数据及与所述关联数据对应的关联数据类型,将所述关联数据确定为所述关联数据类型对应的目标数据。
可选地,所述将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输的步骤之后,处理器1001可以调用存储器1005中存储的业务系统接口识别程序,还执行以下操作:
根据所述目标数据的分类参数对划分后的数据接口进行分类,将所述划分后的数据接口分为不同类别的数据接口,以在目标数据请求时从相应类别的数据接口进行数据传输;所述分类参数包括:请求类型、返回类型、请求方式、访问信息、网址路径深度、请求关联度及响应关联度。
可选地,处理器1001可以调用存储器1005中存储的业务系统接口识别程序,还执行以下操作:
获取分类后每一类数据接口对应的目标数据的特征信息,将所述特征信息作为与每一类数据接口对应的接口信息;
根据所述接口信息定义每一类数据接口,以在目标数据请求时,根据每一类数据接口的定义从相应类别的数据接口进行数据传输。
可选地,所述将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输的步骤之后,处理器1001可以调用存储器1005中存储的业务系统接口识别程序,还执行以下操作:
根据目标数据的数据头源地址字段及目标数据响应体中的超链接,构建各个业务系统接口间的父子关系;
基于所述父子关系生成业务系统的接口关系树,基于所述接口关系树进行业务系统接口的层级关系识别。
参照图2,图2为本发明业务系统接口识别方法的第一实施例流程图,本实施例中,所述业务系统接口识别方法包括以下步骤:
步骤S10:确定业务系统产生的请求响应数据间的关联度数据;
业务系统是帮助基础系统处理业务逻辑,尽量保证基础系统不耦合业务的系统。常见的业务系统有通过url(Uniform Resource Locator,统一资源定位符)区分页面,通过请求参数区分页面及基于restful接口的业务系统。所述restful接口即restful风格的接口,restful可以理解为一种架构的规范与约束、原则,而符合这种架构的的规范与约束、原则的接口即为restful风格的接口;而接口指对协定进行定义的引用类型,可包括程序内部的接口(如登陆与发帖之间的交换,需要抛出一个接口,进行系统内部调用)及系统对外的接口(如购物网站与第三方支付之间,第三方不会提供数据库给购物者,只是提供一个接口,供购物网站进行调用)。通常,基于restful接口的业务系统只请求一次或几次页面,其他数据通过restful接口加载,而不同页面的请求参数及返回结果均不相同,请求数据的格式一般有json(JavaScript Object Notation,JS对象简谱),xml(EXtensible MarkupLanguage,可扩展置标语言)及xxx-urlencoded-form(http的post请求的默认数据格式)等格式,返回数据一般为json及xml格式等,本实施例中的业务系统即以基于restful接口的业务系统为例进行详细阐述,但是并不限于基于restful接口的业务系统,本实施例适用于所有的http/https类型的业务系统。
参照图3,在一具体的应用场景中,业务系统与网关建立通信连接,且网关与用户端建立通信连接。在用户访问业务系统时,通过网关获取与网关建立连接的业务系统的请求与响应数据,并通过数据分析工具对所述获取的请求与响应数据进行分析,再将分析后的数据返回给与网关建立连接的用户端。根据所述分析后的数据便于用户获取用户业务接口的操作情况及下载与上传的数据信息等,方便管理者管理和及时发现风险。因而,在确定业务系统产生的请求响应数据间的关联度数据之前,先要从与业务系统建立通信连接的网关审计所有用户访问业务系统的请求与响应数据,即业务系统产生的请求响应数据。所述业务系统产生的请求响应数据具有不同的数据类型,可能是json格式也可能是xml格式等,因而在网关审计业务系统产生的所有的请求响应数据后,先获取业务系统产生的请求响应数据的数据类型,确定与每个数据类型对应的关联度提取器,运用每个数据类型对应的关联度提取器确定每个数据类型的请求响应数据的关联度数据;其中,所述关联度提取器作为一种关联度提取工具,主要用于提取业务系统产生的的请求响应数据的关联度数据,而不同的数据类型所对应的关联度提取器也有所不同,运用每个数据类型对应的关联度提取器确定每个数据类型的请求响应数据的关联度数据,能够提高关联度数据的可靠性。因而,要确定与每个数据类型对应的关联度提取器先要确定业务系统产生的请求响应数据的数据类型,对业务系统产生的请求响应数据进行分类。
如图4所示,图4为一较优的实施例中确定业务系统产生的请求响应数据间的关联度数据的细化流程示意图。从图中可以看出,本实施例提供一种较优的分类方式,将业务系统产生的请求响应数据分为三种数据类型,进而确定分别与三种数据类型对应的三种关联度提取器。即,当业务系统产生的请求响应数据为第一数据类型时,确定与所述第一数据类型相应的关联度提取器为第一关联度提取器,当所述数据类型为第二数据类型时,确定与所述第二数据类型相应的关联度提取器为第二关联度提取器,当所述数据类型为第三数据类型时,确定与所述第三数据类型相应的关联度提取器为第三关联度提取器。其中第一数据类型为html数据类型,即当请求响应数据为html格式的数据时,确定所述html格式对应的数据类型为第一数据类型;第二数据类型为json数据类型,所述json数据类型包括:xml格式、xxx-urlencoded-form格式及json格式对应的数据类型,即当请求响应数据为xml格式、xxx-urlencoded-form格式及json格式中的任意一种格式对应的数据类型时,都可以认为当前的请求响应数据为第二数据类型;所述第三数据类型为除第一数据类型与第二数据类型外的其他数据类型,即将除html格式、xml格式、xxx-urlencoded-form格式及json格式外的其他格式对应的数据类型确定为第三数据类型。
在确定与每个数据类型对应的关联度提取器后,在请求响应数据为第一数据类型(html数据类型)时,运用第一关联度提取器求取第一数据类型的请求响应数据的风格关联度、结构关联度及显示内容关联度的加权平均值,将所述加权平均值确定为第一数据类型的目标数据的关联度数据,其中风格关联度是将每个数据包中的风格相关字段内容按顺序提取出来,通过所述相关字段比较两个页面的风格类型关联度;结构关联度是提取每个数据包的名称,通过数据包之间的层级关系进行关联度比较;显示内容关联度是按文本内容比较关联度,在进行关联度比较所得的三种关联度取加权平均值,所述加权平均值的权重可以根据关联程度等因素进行确定,由于文本内容存在关联度不高的情况,本实施例中一较优的权重取值方式是将风格关联度、结构关联度及显示内容关联度的权重依次取为0.4,0.4,0.2。在请求响应数据为第二数据类型(json数据类型)时,将去值留键后的请求响应按键的按键名及结构类型作为匹配条件,利用第二关联度提取器计算所述匹配条件被匹配上的匹配次数,根据所述匹配次数确定第二数据类型的目标数据的关联度数据,这里在去值留键之前,若请求相应数据的数据格式为xml格式及xxx-urlencoded-form格式,则需要先将xml格式及xxx-urlencoded-form格式的数据转换为json格式,若为json格式,则直接进行去值留键(清空键值保留键名)处理,方便下一步将键名及结构类型作为匹配条件进行关联度匹配,当两个json数据的按键名或结构类型匹配时记为匹配一次,通过计算所述匹配条件被匹配上的匹配次数计算关联度,计算公式为匹配上次数与总的匹配次数(匹配次数加不匹配次数)的商。在请求响应数据为第三数据类型时,利用第三关联度提取器提取第三数据类型的目标数据的指纹信息,根据所述指纹信息确定第三数据类型的目标数据的关联度数据。
步骤S20:根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上;
根据业务系统产生的请求响应数据间的关联度数据确定请求响应数据间的关联度,判断所述关联度是否超过关联度阈值,若超过,则将关联度超过关联度阈值的请求响应数据确定为目标数据,所述目标数据满足关联度在关联度阈值之上。
由于在所述请求响应数据的数据类型不一致时,可以得到不同类型的请求响应数据对应的关联度数据,因而本实施例提供一较优的实施方式,参照图5,在确定业务系统产生的请求响应数据间的关联度数据之后,根据所述关联度数据确定目标数据的步骤可包括:根据所述关联度数据确定每个数据类型的请求响应数据的关联度;判断每个数据类型的请求响应数据的关联度是否超过对应的关联度阈值;若超过,则确定关联度超过对应的关联度阈值的关联数据及与所述关联数据对应的关联数据类型,将所述关联数据确定为所述关联数据类型对应的目标数据;若不超过,则判定关联度小于相应的关联度阈值的关联数据不为目标数据。而要根据所述关联度数据从不同数据类型的请求响应数据中确定不同数据类型对应的目标数据,首先要根据所述关联度数据确定每个数据类型的请求响应数据的关联度。
具体地,在请求响应数据的数据类型为第一数据类型时,所述关联度数据可包括风格关联度数据、结构关联度数据、显示内容关联度数据、各关联度的权重及通过权重计算后所得的关联度等;在请求响应数据的数据类型为第二数据类型时,所述关联度数据可包括键名匹配上的次数、结构类型匹配上的次数、键名及结构类型同时匹配上的次数以及根据匹配次数计算得到的关联度等;在请求响应数据的数据类型为第三数据类型时,所述关联度数据可包括指纹信息匹配上的次数以及根据指纹匹配次数计算得到的关联度等。根据所述关联度数据可以确定每个数据类型的请求响应数据间的关联度,判断每个数据类型的请求响应数据间的关联度是否超过对应的关联度阈值,若超过,则确定关联度超过对应的关联度阈值的关联数据及与所述关联数据对应的关联数据类型,将所述关联数据确定为所述关联数据类型对应的目标数据,若不超过,则判定关联度不超过对应的关联度阈值的请求响应数据不关联。其中,所述对应的关联度阈值指的是与每个数据类型对应的关联度阈值,即每个数据类型都有一个相应的关联度阈值。
若为第一数据类型,则将第一数据类型的请求响应数据间的关联度与第一数据类型对应的关联度阈值进行比较,判断第一数据类型的请求响应数据间的关联度是否超过第一数据类型对应的关联度阈值,若超过,则将关联度超过第一数据类型对应的关联度阈值的请求响应数据确定为第一关联数据,将与第一关联数据对应的第一数据类型确定为第一关联数据类型,将所述第一关联数据确定为所述第一关联数据类型对应的目标数据;若为第二数据类型,则将第二数据类型的请求响应数据间的关联度与第二数据类型对应的关联度阈值进行比较,判断所述第二数据类型的请求响应数据间的关联度是否超过第二数据类型对应的关联度阈值,若超过,则将关联度超过第二数据类型对应的关联度阈值的请求响应数据确定为第二关联数据,将与第二关联数据对应的第二数据类型确定为第二关联数据类型,将所述第二关联数据确定为所述第二关联数据类型对应的目标数据;若为第三数据类型,则将第三数据类型的请求响应数据间的关联度与第三数据类型对应的关联度阈值进行比较,判断所述第三数据类型的请求响应数据间的关联度是否超过第三数据类型对应的关联度阈值,若超过,则将关联度超过第三数据类型对应的关联度阈值的请求响应数据确定为第三关联数据,将与第三关联数据对应的第三数据类型确定为第三关联数据类型,将所述第三关联数据确定为所述第三关联数据类型对应的目标数据。如此便可根据业务系统产生的请求响应数据间的关联度数据确定不同数据类型对应的目标数据。
步骤S30:将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输;
根据业务系统的请求响应数据的关联度数据,将关联度超过关联度阈值的请求响应数据确定为目标数据之后,将所述目标数据的业务接口划分为同一个数据接口。由于在将每个数据类型的请求响应数据间的关联度的确定过程中,都是将对应数据类型的第一个请求响应数据作为参考数据,而将相应数据类型后续的请求响应数据与第一个数据比较得到关联度,因而,在相应数据类型的请求响应数据的个数为N(N为自然数)个时,得到的关联度有N-1个,而N-1个关联度中超过对应的关联度阈值的关联度可能是零个、一个或多个,对应的目标数据也可能是零个、一个或多个,将所述目标数据的业务接口划分为同一个数据接口后,得到的划分后的数据接口对应地也可能是零个、一个或多个。无论所述划分后的数据接口是一个还是多个,将所述目标数据的业务接口划分为同一个数据接口后减少了接口的数量,使得在业务系统接收到目标数据请求时,能够更加快速的找到与目标数据对应的接口,以从所述数据接口进行数据传输。值得说明的是,当所述划分后的数据接口为零个时,即业务系统产生的请求响应数据中不存在关联度高于对应的关联度阈值的目标数据,此时,将关联度小于或等于对应的关联度阈值的请求响应数据作为不关联数据,并直接保留不关联数据的业务接口作为与所述不关联数据对应的数据接口。
本实施例通过确定业务系统产生的请求响应数据间的关联度数据,以根据所述关联度数据将关联度高于关联度阈值的请求响应数据确定为目标数据,并将目标数据的业务接口划分为同一个数据接口,以在接收到与目标数据相应的请求时,从所述划分后的数据接口进行数据的输入或输出,根据关联度数据进行业务接口合并,便于根据合并后的数据接口识别目标数据访问业务系统的访问情况及上传下载情况等,且便于系统管理者对数据接口进行集中管理,有利于提高接口识别与接口管理的效率。
参照图6,图6为本发明业务系统接口识别方法的第二实施例流程图,本实施例中,所述业务系统接口识别方法包括以下步骤:
步骤S11:确定业务系统产生的请求响应数据间的关联度数据;
步骤S12:根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上;
步骤S13:将所述目标数据的业务接口划分为同一个数据接口;
步骤S14:根据所述目标数据的分类参数对划分后的数据接口进行分类,将所述划分后的数据接口分为不同类别的数据接口,以在目标数据请求时从相应类别的数据接口进行数据传输。
本实施例中,确定业务系统产生的请求响应数据间的关联度数据,根据所述关联度数据确定目标数据,将所述目标数据的业务接口划分为同一个数据接口之后,由于所述划分后的数据接口可能存在多个的情况,在划分后的数据接口较多时,若不将划分后的数据接口进行分类贴上标签,在接口识别过程中容易出现识别时间长、识别过程容易出错,且不利用业务系统的管理者对众多的接口进行管理。
因而本实施例提供一种较优的分类方式,根据所述目标数据的分类参数对划分后的数据接口进行分类,将所述划分后的数据接口分为不同类别的数据接口,所述分类参数包括请求类型、返回类型、请求方式、访问信息、网址路径深度、请求关联度及响应关联度,其中请求类型指的是业务系统产生的请求数据的数据类型,包括json/xml/url_args/urlencoded-form等;返回类型指的是业务系统产生的响应数据的数据类型,包括json/xml/html等;请求方式包括资源获取GET及新建资源POST等;访问信息与http头中的host字段对应,通过host字段可以获取客户端指定访问的http服务器的域名/IP地址以及端口号信息;网址路径深度即url深度,表示网页含有多少个层级;请求关联度指的是业务系统产生的请求数据的关联度,包括不同数据类型的请求数据的关联度;响应关联度指的是业务系统产生的响应数据的关联度,包括不同数据类型的响应数据的关联度。上述参数作为分类参数仅为本实施例的一较优实施例。所述分类参数还可以是将上述参数与其他参数结合作为分类参数,或是选取上述参数中的一个或多个参数作为分类参数,或是从上述参数中选取部分参数结合其他参数作为分类参数,当然,还可以是不包括上述参数的其他参数作为分类参数等。具体可根据业务系统的类型,业务系统的应用环境及数据接口的数量等选择相应的参数作为分类参数,此处对分类参数所包含的具体参数不做限定。
根据所述目标数据的分类参数将所述划分后的数据接口分为不同类别的数据接口后,获取分类后每一类数据接口对应的目标数据的特征信息,所述特征信息为每一类数据接口所对应的目标数据的共同信息,将所述共同信息作为每一类数据接口所对应的目标数据的特征信息,再将所述特征信息作为与每一类数据接口对应的接口信息对每一类数据接口进行定义(也可以说是为每一类数据接口贴上对应的标签),在业务系统接收到目标数据请求时,根据每一类数据接口的定义,可以很容易地根据接口信息从相应类别的数据接口进行数据传输。
本实施例通过确定业务系统产生的请求响应数据间的关联度数据,根据所述关联度数据将关联度高于关联度阈值的请求响应数据确定目标数据,在确定目标数据后,将所述目标数据的业务接口划分为同一个数据接口,并根据所述目标数据的分类参数对划分后的数据接口进行分类,将所述划分后的数据接口分为不同类别的数据接口,以在目标数据请求时从相应类别的数据接口进行数据传输,便于业务系统根据分类后的数据接口识别与目标数据请求相应的数据接口,且便于用户根据分类后的数据接口进行接口管理与业务系统的管理,进一步提高了业务系统接口识别的效率与效率,也进一步提高了业务系统接口管理的效率与效果。
参照图7,图7为本发明业务系统接口识别方法的第三实施例流程图,本实施例中,所述业务系统接口识别方法包括以下步骤:
步骤S21:确定业务系统产生的请求响应数据间的关联度数据;
步骤S22:根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上;
步骤S23:将所述目标数据的业务接口划分为同一个数据接口;
步骤S24:根据目标数据的数据头源地址字段及目标数据响应体中的超链接,构建各个业务系统接口间的父子关系;
步骤S25:基于所述父子关系生成业务系统的接口关系树,基于所述接口关系树进行业务系统接口的层级关系识别。
本实施例中,在确定业务系统产生的请求响应数据间的关联度数据,根据所述关联度数据将关联度高于想湿度阈值的请求响应数据确定为目标数据,将目标数据的业务接口划分为同一个数据接口之后,根据目标数据的数据头源地址字段及目标数据响应体中的超链接,构建各个业务系统接口间的父子关系,基于所述父子关系生成业务系统的接口关系树,基于所述接口关系树进行业务系统接口的层级关系识别。
具体地,参照图8,基于上一步识别出的业务接口,判断标题中是否存在“主页(home)”、“仪表盘(dashbord)”及“工作台”等标志性字段,若标题中存在所述标志性字段,则将当前业务接口标记为home/title等,若标题中不存在所述标志性字段,则判断url中最后路径是否含有“主页(home)”、“仪表盘(dashbord)”及“工作台”等标志性字段,若url中最后路径存在所述标志性字段,则标记为home/url,若url中最后路径不存在所述标志性字段,则聚合同一个业务接口,按照优先级依次为home/title、home/url、最短url的优先级顺序,选出最有可能的业务接口为主页。与此同时,根据请求数据的数据头源地址(referer)字段提取出父端业务接口,再判断返回数据是否为html格式,若返回数据为html格式,则解析href标签(指定超链接目标的url),提取出子端业务接口,若返回数据不是html格式,则聚合同一业务接口,根据父端业务接口与子端业务接口对应的父子关系,建立出每个接口的关系图。接着,在选出主页并建立每个接口的关系图之后,根据优先级为home/title、最短url、根节点的优先级顺序重新获取最后的根节点,并通过广度优先搜索化简关系图,生成业务系统的接口关系树,基于所述接口关系树可以识别业务系统接口的层级关系。
本实施例通过确定业务系统产生的请求响应数据间的关联度数据,根据所述关联度数据确定目标数据,在确定目标数据后将所述目标数据的业务接口划分为同一个数据接口,在接口合并后,根据目标数据的数据头源地址字段及目标数据响应体中的超链接,构建各个业务系统接口间的父子关系,基于所述父子关系生成业务系统的接口关系树,根据所述接口关系树不仅能实现接口识别,而且能够识别不同接口之间的层级关系,根据所述层级关系能够更为快速的实现接口识别,且识别过程不易出错,提高了接口识别的效率与效果,且根据所述层级关系能够缩短用户进行接口管理的时间,管理过程也更方便,因而也提高了接口管理的效率与效果。
此外,本发明实施例还提供一种业务系统接口识别装置,所述业务系统接口识别装置包括存储器、处理器及存储在所述处理器上并可在处理器上运行的业务系统接口识别程序,所述处理器执行所述业务系统接口识别程序时实现如上所述业务系统接口识别方法的步骤。
此外,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有业务系统接口识别程序,所述业务系统接口识别程序被处理器执行时实现如上所述的业务系统接口识别方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,电视,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种业务系统接口识别方法,其特征在于,所述业务系统接口识别方法包括以下步骤:
确定业务系统产生的请求响应数据间的关联度数据;
根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上;
将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输。
2.如权利要求1所述的业务系统接口识别方法,其特征在于,所述确定业务系统产生的请求响应数据间的关联度数据的步骤包括:
获取业务系统产生的请求响应数据的数据类型,确定与每个数据类型对应的关联度提取器;
运用每个数据类型对应的关联度提取器确定每个数据类型的请求响应数据间的关联度数据。
3.如权利要求2所述的业务系统接口识别方法,其特征在于,所述获取业务系统产生的请求响应数据的数据类型,确定与每个数据类型对应的关联度提取器的步骤包括:
若所述数据类型为第一数据类型,则确定与所述第一数据类型相应的关联度提取器为第一关联度提取器;
若所述数据类型为第二数据类型,则确定与所述第二数据类型相应的关联度提取器为第二关联度提取器;
若所述数据类型为第三数据类型,则确定与所述第三数据类型相应的关联度提取器为第三关联度提取器;其中,所述第一数据类型为html数据类型,所述第二数据类型为json数据类型,所述json数据类型包括:xml格式与xxx-urlencoded-form格式及json格式对应的数据类型,所述第三数据类型为除第一数据类型与第二数据类型外的其他数据类型。
4.如权利要求3所述的业务系统接口识别方法,其特征在于,所述运用每个数据类型对应的关联度提取器确定每个数据类型的请求响应数据间的关联度数据的步骤包括:
若所述数据类型为第一数据类型,则运用第一关联度提取器求取第一数据类型的请求响应数据的风格关联度、结构关联度及显示内容关联度的加权平均值,将所述加权平均值确定为第一数据类型的目标数据的关联度数据;
若所述数据类型为第二数据类型,则将去值留键后的请求响应按键的按键名及结构类型作为匹配条件,利用第二关联度提取器计算所述匹配条件被匹配上的匹配次数,根据所述匹配次数确定第二数据类型的目标数据的关联度数据;
若所述数据类型为第三数据类型,则利用第三关联度提取器提取第三数据类型的目标数据的指纹信息,根据所述指纹信息确定第三数据类型的目标数据的关联度数据。
5.如权利要求1-4任一项所述的业务系统接口识别方法,其特征在于,所述根据所述关联度数据确定目标数据,所述目标数据中请求响应数据间的关联度在关联度阈值之上的步骤包括:
根据所述关联度数据确定每个数据类型的请求响应数据间的关联度;
判断每个数据类型的请求响应数据间的关联度是否超过对应的关联度阈值;
若超过,则确定关联度超过对应的关联度阈值的关联数据及与所述关联数据对应的关联数据类型,将所述关联数据确定为所述关联数据类型对应的目标数据。
6.如权利要求1所述的业务系统接口识别方法,其特征在于,所述将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输的步骤之后,还包括:
根据所述目标数据的分类参数对划分后的数据接口进行分类,将所述划分后的数据接口分为不同类别的数据接口,以在目标数据请求时从相应类别的数据接口进行数据传输;所述分类参数包括:请求类型、返回类型、请求方式、访问信息、网址路径深度、请求关联度及响应关联度。
7.如权利要求6所述的业务系统接口识别方法,其特征在于,所述将所述划分后的数据接口分为不同类别的数据接口,以在目标数据请求时从相应类别的数据接口进行数据传输的步骤包括:
获取分类后每一类数据接口对应的目标数据的特征信息,将所述特征信息作为与每一类数据接口对应的接口信息;
根据所述接口信息定义每一类数据接口,以在目标数据请求时,根据每一类数据接口的定义从相应类别的数据接口进行数据传输。
8.如权利要求1所述的业务系统接口识别方法,其特征在于,所述将所述目标数据的业务接口划分为同一个数据接口,以在目标数据请求时从所述数据接口进行数据传输的步骤之后,还包括:
根据目标数据的数据头源地址字段及目标数据响应体中的超链接,构建各个业务系统接口间的父子关系;
基于所述父子关系生成业务系统的接口关系树,基于所述接口关系树进行业务系统接口的层级关系识别。
9.一种业务系统接口识别装置,其特征在于,所述装置包括存储器、处理器及存储在存储器上并可在处理器上运行的业务系统接口识别程序,所述处理器执行所述业务系统接口识别程序时实现权利要求1-8中任一项所述的业务系统接口识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有业务系统接口识别程序,所述业务系统接口识别程序被处理器执行时实现如权利要求1-8中任一项所述的业务系统接口识别方法的步骤。
CN201911425810.0A 2019-12-31 2019-12-31 业务系统接口识别方法、装置及存储介质 Active CN111209325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911425810.0A CN111209325B (zh) 2019-12-31 2019-12-31 业务系统接口识别方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911425810.0A CN111209325B (zh) 2019-12-31 2019-12-31 业务系统接口识别方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111209325A true CN111209325A (zh) 2020-05-29
CN111209325B CN111209325B (zh) 2024-02-23

Family

ID=70788611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911425810.0A Active CN111209325B (zh) 2019-12-31 2019-12-31 业务系统接口识别方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111209325B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528307A (zh) * 2020-12-18 2021-03-19 平安银行股份有限公司 服务请求校验方法、装置、电子设备及存储介质
CN112905273A (zh) * 2021-03-29 2021-06-04 中国建设银行股份有限公司 一种服务调用方法和装置
CN112992137A (zh) * 2021-01-29 2021-06-18 青岛海尔科技有限公司 语音交互方法和装置、存储介质及电子装置
CN114443732A (zh) * 2021-12-29 2022-05-06 格美安(北京)信息技术有限公司 一种动态接口调用方法及存储介质
CN114885359A (zh) * 2022-06-09 2022-08-09 中国联合网络通信集团有限公司 时延性能评估方法、接入网设备及存储介质
CN117237850A (zh) * 2023-09-28 2023-12-15 河南新启通信有限公司 一种基于多种数据来源的数据标注系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080215673A1 (en) * 2007-03-01 2008-09-04 International Business Machines Corporation Data Processing Method For Generating Service Interface Descriptions
CN103970899A (zh) * 2014-05-27 2014-08-06 重庆大学 面向服务的元数据关联性提取管理方法及其管理系统
US20180113586A1 (en) * 2016-10-25 2018-04-26 International Business Machines Corporation Context aware user interface
CN110515676A (zh) * 2019-07-11 2019-11-29 平安普惠企业管理有限公司 接口整合方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080215673A1 (en) * 2007-03-01 2008-09-04 International Business Machines Corporation Data Processing Method For Generating Service Interface Descriptions
CN103970899A (zh) * 2014-05-27 2014-08-06 重庆大学 面向服务的元数据关联性提取管理方法及其管理系统
US20180113586A1 (en) * 2016-10-25 2018-04-26 International Business Machines Corporation Context aware user interface
CN110515676A (zh) * 2019-07-11 2019-11-29 平安普惠企业管理有限公司 接口整合方法、装置、设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528307A (zh) * 2020-12-18 2021-03-19 平安银行股份有限公司 服务请求校验方法、装置、电子设备及存储介质
CN112528307B (zh) * 2020-12-18 2025-04-22 平安银行股份有限公司 服务请求校验方法、装置、电子设备及存储介质
CN112992137A (zh) * 2021-01-29 2021-06-18 青岛海尔科技有限公司 语音交互方法和装置、存储介质及电子装置
CN112905273A (zh) * 2021-03-29 2021-06-04 中国建设银行股份有限公司 一种服务调用方法和装置
CN114443732A (zh) * 2021-12-29 2022-05-06 格美安(北京)信息技术有限公司 一种动态接口调用方法及存储介质
CN114885359A (zh) * 2022-06-09 2022-08-09 中国联合网络通信集团有限公司 时延性能评估方法、接入网设备及存储介质
CN117237850A (zh) * 2023-09-28 2023-12-15 河南新启通信有限公司 一种基于多种数据来源的数据标注系统

Also Published As

Publication number Publication date
CN111209325B (zh) 2024-02-23

Similar Documents

Publication Publication Date Title
CN111209325B (zh) 业务系统接口识别方法、装置及存储介质
US12112144B2 (en) API specification generation
US9954886B2 (en) Method and apparatus for detecting website security
US10452730B2 (en) Methods for analyzing web sites using web services and devices thereof
US9910858B2 (en) System and method for providing contextual analytics data
CN110798445B (zh) 公共网关接口测试方法、装置、计算机设备及存储介质
CN115309968A (zh) 一种基于资源搜索引擎生成网页指纹规则的方法、装置
US20240241923A1 (en) Advanced data collection block identification
CN108228875A (zh) 基于完美哈希的日志解析方法及装置
CN113032836B (zh) 数据脱敏方法和装置
KR20190058141A (ko) 문서로부터 추출되는 데이터를 생성하는 방법 및 그 장치
CN116776030A (zh) 灰度发布方法、装置、计算机设备、存储介质
CN107786529B (zh) 网站的检测方法、装置及系统
CN105893584A (zh) 一种显示收藏夹网址标签的方法、客户端和系统
CN109862074B (zh) 一种数据采集方法、装置、可读介质及电子设备
CN110889027A (zh) 访问网页页面的方法、装置、终端设备及服务器
CN114089997B (zh) 页面栈的处理方法和装置、存储介质及电子装置
US20140337069A1 (en) Deriving business transactions from web logs
CN114765599A (zh) 子域名采集方法、装置
CN112000313A (zh) 请求响应方法、装置、设备及存储介质
CN116127945B (zh) 网络链接处理方法和装置、电子设备、存储介质
US20040054682A1 (en) Hypertext analysis method, analysis program, and apparatus
CN110704498A (zh) 数据提取方法、装置、设备及计算机可读存储介质
CN105677827B (zh) 一种表单的获取方法及装置
CN112866140B (zh) 业务匹配方法、网关管理平台、网关设备和服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant