CN112395336B

CN112395336B - 一种长时间序列数据管理和可视化方法

Info

Publication number: CN112395336B
Application number: CN202011358853.4A
Authority: CN
Inventors: 徐佳佳; 易忠; 李曼丽; 赵晶晶; 何磊; 张海英; 邱逸昌; 李梦; 韩兴龙; 周乐; 赵永平; 张旭明; 袁坤; 曹志杰; 原奕; 黄魁; 仇玉雪
Original assignee: Beijing Institute of Spacecraft Environment Engineering
Current assignee: Beijing Institute of Spacecraft Environment Engineering
Priority date: 2020-11-27
Filing date: 2020-11-27
Publication date: 2024-03-19
Anticipated expiration: 2040-11-27
Also published as: CN112395336A

Abstract

本申请提供一种长时间序列数据管理和可视化方法，所述方法包括如下步骤：确定长时间序列数据的降精尺度集Tc；根据降精尺度集Tc对长时间序列数据进行降精处理，得到多个时间序列数据子集，并将各个时间序列数据子集存储到数据库中；获取用户设定的数据查询时间宽度T_w；从数据库中检索满足所述时间宽度T_w的时间序列数据子集，并将其以曲线的方式在客户端进行展示。本发明提供的长时间序列数据管理和可视化方法能够完成时序数据曲线的可视化，该方法采用了降精处理的方法，以不同的降精尺度实现对长时间序列数据的降精处理，并将降精处理得到的时间序列数据子集存储在数据库中，以便于后期对长时间序列数据进行管理和可视化展示。

Description

一种长时间序列数据管理和可视化方法

技术领域

本申请涉及工业数据采集存储技术领域，尤其涉及一种长时间序列数据管理和可视化方法。

背景技术

随着5G技术的发展，物联网技术已经被广泛应用到城市管理、物流管理以及工业生产过程中，这就涉及到长时间的时间序列数据的存储。目前，已经有了较多的时间序列数据库技术，能够解决长时间的海量数据的存储问题，但是，后期长时间序列数据的可视化尚未有较好的方法，而且无论是采用像素点直接生成图片，还是直接利用可视化插件，都难以直接完成时序数据曲线的可视化。

发明内容

本申请的目的是针对以上问题，提供一种长时间序列数据管理和可视化方法。

本申请提供一种长时间序列数据管理和可视化方法，所述方法包括如下步骤：

S1、确定长时间序列数据的降精尺度集Tc；

S2、根据降精尺度集Tc对长时间序列数据进行降精处理，得到多个时间序列数据子集，并将各个时间序列数据子集存储到数据库中；

S3、获取用户设定的数据查询时间宽度T_w；

S4、从数据库中检索满足所述时间宽度T_w的时间序列数据子集，并将其以曲线的方式在客户端进行展示。

进一步的，所述降精尺度集Tc包括n个数值互不相同的降精尺度，n为2～20中的任意自然数。

进一步的，确定长时间序列数据的降精尺度集Tc的方法包括：

S10、判断长时间序列数据的数据类型是否为实时数据；

S11、当长时间序列数据的数据类型是实时数据时，根据采集设备的采样周期确定降精尺度集Tc；

S12、当长时间序列数据的数据类型不是实时数据时，采用如下步骤来确定降精尺度集Tc：

S121、根据长时间序列数据的原始采样频率F₀来确定最小时间宽度Tc_min，Tc_min的表达式为Tc_min＝1/F₀；

S122、确定最大时间宽度Tc_max，Tc_max的表达式为

Tc_max＝Pmax/[(Te-Ts)*F₀]

其中，Pmax为可视化工具所能容纳的最大数据集，Te为长时间序列数据的结束时间，Ts为长时间序列数据的开始时间，F₀为长时间序列数据的原始采样频率；

S123、在Tc_min～Tc_max范围内选取n个互不相同的数值，组成降精尺度集Tc。

进一步的，根据降精尺度集Tc对长时间序列数据进行降精处理时，具体包括：

S20、判断长时间序列数据的数据类型是否为实时数据；

S21、当长时间序列数据的数据类型是实时数据时，将采集设备采集到的原始数据存储到数据库中，并在存储的过程中，依据降精尺度集Tc对长时间序列数据进行降精处理；

S22、当长时间序列数据的数据类型不是实时数据时，判断数据文件的大小是否超过初始设定值D₀；

S221、当数据文件的大小超过初始设定值D₀时，采用Map-Reduce编程模型来完成降精处理；

S222、当数据文件的大小未超过初始设定值D₀时，采用单机程序来完成降精处理。

进一步的，所述初始设定值D₀的取值为20G。

与现有技术相比，本申请的有益效果：该长时间序列数据管理和可视化方法能够完成时序数据曲线的可视化，该方法采用了降精处理的方法，以不同的降精尺度实现对长时间序列数据的降精处理，并将降精处理得到的时间序列数据子集存储在数据库中，以便于后期对长时间序列数据进行管理和可视化展示。

附图说明

图1为本申请实施例提供的长时间序列数据管理和可视化方法的流程图；

图2为图1中步骤S1具体实施的流程示意图；

图3为图1中步骤S2具体实施的流程示意图。

具体实施方式

为了使本领域技术人员更好地理解本申请的技术方案，下面结合附图对本申请进行详细描述，本部分的描述仅是示范性和解释性，不应对本申请的保护范围有任何的限制作用。

请参考图1，本实施例提供一种长时间序列数据管理和可视化方法，所述方法包括如下步骤：

S1、确定长时间序列数据的降精尺度集Tc。

所述降精尺度集Tc是一个集合，它包括n个数值互不相同的降精尺度，n为2～20中的任意自然数，n一般取5或者6为宜。

请参考图2，确定长时间序列数据的降精尺度集Tc的具体步骤包括：

S10、判断长时间序列数据的数据类型是否为实时数据。

长时间序列数据的包括两种类型，一种是实时采集的实时数据，另外一种是已经采集完的离线数据，对于两种不同类型的长时间序列数据，采用不同的方法来确定降精尺度集Tc。

S11、当长时间序列数据的数据类型是实时数据时，根据采集设备的采样周期确定降精尺度集Tc。

采集设备一般是指传感器，降精尺度集Tc可根据经验自行定义，降精尺度集Tc中最小的取值不小于采集设备的采样周期，比如，降精尺度集Tc的取值为Tc＝{0.5s，1s，10s，60s，600s}。

S122、确定最大时间宽度Tc_max，Tc_max的表达式为

Tc_max＝Pmax/[(Te-Ts)*F₀]

S123、在Tc_min～Tc_max范围内选取n个互不相同的数值，组成降精尺度集Tc。一般地，降精尺度集Tc的取值为Tc＝{1/F₀，2/F₀，3/F₀，4/F₀，5/F₀，......}，其中F₀为该长时间序列数据的原始采样频率。

当长时间序列数据的数据类型不是实时数据，即是离线数据时，该长时间序列数据的大小是已知的，此时需要将该长时间序列数据的大小与可视化工具所能容纳的最大数据集Pmax的大小做比较，本实施例的步骤是以该长时间序列数据的大小不大于Pmax为例给出的，当该长时间序列数据的大小大于Pmax时，需要先将该长时间序列数据进行分段，再确保每段数据的大小均不大于Pmax，然后再对每一段数据采用本实施例的方法进行相应地处理。

S2、根据降精尺度集Tc对长时间序列数据进行降精处理，得到多个时间序列数据子集，并将各个时间序列数据子集存储到数据库中。

多个时间序列数据子集可分为不同的层级，层级的数量与的数量一致，均为n，每个层级与降精尺度集Tc中的一个降精尺度相对应，降精尺度越小，其对应的时间序列数据子集的层级就越低。

请参考图3，根据降精尺度集Tc对长时间序列数据进行降精处理时，具体包括：

S20、判断长时间序列数据的数据类型是否为实时数据；

S22、当长时间序列数据的数据类型不是实时数据时，判断数据文件的大小是否超过初始设定值D₀。一般地，所述初始设定值D₀的取值为20G。

S221、当数据文件的大小超过初始设定值20G时，采用Map-Reduce编程模型来完成降精处理。

S222、当数据文件的大小未超过初始设定值20G时，采用单机程序来完成降精处理。对于小于20G的离线数据，单机程序采用分段读取的方法即可完成对数据的降精处理。

S3、获取用户设定的数据查询时间宽度T_w。该时间宽度T_w是用户在可视化工具的系统中根据实际需要自行设置的。

具体地，系统会根据时间宽度T_w从数据库中进行检索，检索与该时间宽度T_w相匹配层级的时间序列数据子集，并将其在客户端以曲线的方式进行展示。在客户端，用户可以根据需要通过设置不同的时间宽度T_w，来获取不同层级的时间序列数据子集所对应的曲线。

本申请实施例提供的长时间序列数据管理和可视化方法，以不同的降精尺度对长时间序列数据进行降精处理来实现对数据降维，并将降精处理得到的时间序列数据子集存储在数据库中，以便于后期对长时间序列数据进行管理和可视化展示；该方法既适用于实时采集的数据，又适用于之前采集的离线数据；该方法数据可视化响应快，用户在客户端获取到的是通过降精的数据，数据量小数据可视化效率高。

本申请实施例提供的长时间序列数据管理和可视化方法，不仅能够应用于水下探测领域，也可以拓展应用在物联网领域、制造领域、电子商务交易领域以及其它应用到时间序列数据分析的领域。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。以上所述仅是本申请的优选实施方式，应当指出，由于文字表达的有限性，而客观上存在无限的具体结构，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以作出若干改进、润饰或变化，也可以将上述技术特征以适当的方式进行组合；这些改进润饰、变化或组合，或未经改进将发明的构思和技术方案直接应用于其他场合的，均应视为本申请的保护范围。

Claims

1.一种长时间序列数据管理和可视化方法，其特征在于，所述方法包括如下步骤：

S1、确定长时间序列数据的降精尺度集Tc；

具体步骤包括：

S10、判断长时间序列数据的数据类型是否为实时数据；

S122、确定最大时间宽度Tc_max，Tc_max的表达式为

Tc_max＝Pmax/[(Te-Ts)*F₀]

S123、在Tc_min～Tc_max范围内选取n个互不相同的数值，组成降精尺度集Tc；

S3、获取用户设定的数据查询时间宽度T_w；

2.根据权利要求1所述的长时间序列数据管理和可视化方法，其特征在于，所述降精尺度集Tc包括n个数值互不相同的降精尺度，n为2～20中的任意自然数。

3.根据权利要求2所述的长时间序列数据管理和可视化方法，其特征在于，根据降精尺度集Tc对长时间序列数据进行降精处理时，具体包括：

S20、判断长时间序列数据的数据类型是否为实时数据；

4.根据权利要求3所述的长时间序列数据管理和可视化方法，其特征在于，所述初始设定值D₀的取值为20G。