[go: up one dir, main page]

CN116152669A - 一种基于注意力机制的土地变化类型检测方法及装置 - Google Patents

一种基于注意力机制的土地变化类型检测方法及装置 Download PDF

Info

Publication number
CN116152669A
CN116152669A CN202211542600.1A CN202211542600A CN116152669A CN 116152669 A CN116152669 A CN 116152669A CN 202211542600 A CN202211542600 A CN 202211542600A CN 116152669 A CN116152669 A CN 116152669A
Authority
CN
China
Prior art keywords
data
training
dual
temporal
sar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211542600.1A
Other languages
English (en)
Other versions
CN116152669B (zh
Inventor
李世华
刘玉婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202211542600.1A priority Critical patent/CN116152669B/zh
Publication of CN116152669A publication Critical patent/CN116152669A/zh
Application granted granted Critical
Publication of CN116152669B publication Critical patent/CN116152669B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于注意力机制的土地变化类型检测方法及装置,该方法包括:获取训练双时相SAR数据和训练双时相光学数据;将训练双时相SAR数据进行第一预处理得到第一训练数据,将训练双时相光学数据进行第二预处理得到第二训练数据;将第一训练数据和第二训练数据输入至预设神经网络中进行训练;获取待检测区域的双时相SAR数据和双时相光学数据,并将双时相SAR数据进行第一预处理得到第一数据,将双时相光学数据进行第三预处理得到第二数据;将第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,实现了快速准确地对土地变化类型进行检测,且无需复杂方程式,其适用性较高。

Description

一种基于注意力机制的土地变化类型检测方法及装置
技术领域
本发明属于土地变化类型检测技术领域,具体涉及一种基于注意力机制的土地变化类型检测方法及装置。
背景技术
土地变化类型检测通常是通过变化检测算法来对同一地区不同时相的遥感影像定量地比较、分析和确定出地表变化特征的研究,也即由一种地物变成另一种地物的研究,随着世界人口的迅速增长,目前人类正面临严重的森林退化、荒漠化、土壤流失、土地减产和生物多样性消失等严重问题,土地覆盖的变化检测的必要性越来越凸显出来,遥感技术具有实时、快速、覆盖范围广以及周期性等特点,但是光学遥感图像在多云多雨地区难以获取高质量的影像,这对变化检测具有较大的影响,而不受云雨天气影响的合成孔径雷达数据(Synthetic Aperture Radar,SAR)成为其重要的可替代数据。
当前通过SAR数据进行土地变化检测的方法是通过勾绘变化矢量辅以实地调研的方式进行,这种方法人为主观因素的干扰,且效率低下,不利于获取大区域变化检测结果,难以适应高效的土地管理模式,一些的阈值分割、分类等算法在进行土地变化检测的时候,存在各种缺陷,例如仅使用初始特征进行运算,高维和抽象特征未经表达,并且特征需要人工定义和计算,通过复杂的目标方程式进行迭代,然后判断变化类型,其算法适用性较差。
因此,如何提供一种快速准确且适用性较高的土地变化类型检测方法是本领域技术人员有待解决的技术问题。
发明内容
本发明的目的是为了解决现有技术中对土地变化类型检测复杂性较高且适用性较低的技术问题。
为实现上述技术目的,一方面,本发明提供了一种基于注意力机制的土地变化类型检测方法,该方法包括:
获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;
将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据;
将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络;
获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据;
将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域。
进一步地,所述土地变化类型具体包括未变化类型、耕地变果园类型、耕地变道路类型、裸地变建筑用地类型和其他变化类型。
进一步地,所述预设神经网络具体为:将所述注意力模块分别插入所述U-Net网络中编码器每层的卷积之后和池化之前,插入完成后的U-Net网络即为所述预设神经网络,所述预设神经网络包括编码器和解码器,编码器用于特征提取,所述编码器包括反卷积和双线性差值两种上采样,通过跳跃连接融合经过注意力模块的特征图和经过上采样的特征图。
进一步地,所述双时相SAR数据和训练双时相SAR数据均为双时相全极化SAR数据,所述第一预处理具体包括:
根据所述输入数据的极化分解方式提取SAR特征影像,所述输入数据具体为训练双时相SAR数据或双时相SAR数据;
将所述SAR特征影像做对数比值从而获取特征差异影像;
将所述特征差异影像进行标准化;
将进行标准化后的特征差异影像依次进行裁剪和重采样。
进一步地,所述第二预处理具体包括:
将所述训练双时相光学数据依次进行辐射标定、大气校正和配准得到一级训练数据;
根据所述一级训练数据制作对应的矢量标签数据;
将所述矢量标签数据中各土地变化类型赋予属性,所述属性包括未变化属性、耕地变果园属性、耕地变道路属性、裸地变建筑用地属性和其他变化属性;
将赋予属性后的矢量标签数据进行栅格化得到对应的单通道标签图像;
将所述单通道标签图像转换为多通道的RGB标签图像;
将所述RGB标签图像进行依次裁剪和重采样。
进一步地,所述第三预处理具体包括:
将所述双时相光学数据依次进行辐射标定、大气校正和配准后得到一级数据;
将所述一级数据依次进行裁剪和重采样。
进一步地,所述将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,具体包括:
将所述第一训练数据和第二训练数据进行数据增强处理得到对应的第一增强训练数据和第二增强训练数据;
根据训练、测试和验证之间8:1:1的比例分别对所述第一增强训练数据和第二增强训练数据进行分配;
将分配好的第一增强训练数据和第二增强训练数据输入至所述预设神经网络中进行训练。
另一方面,本发明还提供了一种基于注意力机制的土地变化类型检测装置,所述装置包括:
第一获取模块,用于获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;
预处理模块,用于将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据;
训练模块,用于将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络;
第二获取模块,用于获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据;
识别检测模块,用于将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域。
进一步地,所述预设神经网络具体为:将所述注意力模块分别插入所述U-Net网络中编码器每层的卷积之后和池化之前,插入完成后的U-Net网络即为所述预设神经网络,所述预设神经网络包括编码器和解码器,编码器用于特征提取,所述编码器包括反卷积和双线性差值两种上采样,通过跳跃连接融合经过注意力模块的特征图和经过上采样的特征图。
与现有技术相比,本发明具备以下有益效果:
本发明通过获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据;将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络;获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据;将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域,实现了快速准确地对土地变化类型进行检测,且无需复杂方程式,其适用性较高。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示为本发明实施例提供的一种基于注意力机制的土地变化类型检测方法的流程示意图;
图2所示为本发明实施例提供的一种基于注意力机制的土地变化类型检测装置的结构示意图;
图3所示为本发明实施例提供的预设神经网络的结构示意图;
图4所示为本发明实施例提供的基于注意力机制的土地变化类型检测服务器的硬件结构框图。
具体实施方式
为了使本领域普通技术人员更好地理解本说明书中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示为本说明实施例提供的基于注意力机制的土地变化类型检测方法的流程示意图,虽然本说明提供了如下实施例或附图中所示的方法操作步骤或装置结构,但基于常规或无需创造性劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元,在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构在实际中的装置、服务器或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集群的实施环境)。
本说明实施例中提供的基于注意力机制的土地变化类型检测方法可以应用在客户端和服务器等终端设备中,如图1所示,所述方法具体包括如下步骤:
步骤S101、获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;
具体的,双时相SAR数据和训练双时相SAR数据均为双时相全极化SAR数据,其更加完整的记录了待检测区域的回波散射信息,双时相全极化SAR数据分类结果既可为目标检测、边缘提取等进一步的分析或者解译提供辅助信息,也可作为最终结果,这是为了更好对待检测区域进行土地变化类型识别检测,所述双时相光学数据为高分二号数据,双时相的高分辨率数据能够清晰地反映变化类型,为标签制作提供数据支持。
步骤S101、将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据。
具体的,需要进行识别检测的区域通常较大,数据量也较大,常规方法繁琐复杂,因此,先提取出一部分的训练区域,通过训练区域的数据来对预设神经网络进行训练,以使训练好的预设神经网络对待识别检测区域进行土地变化类型识别检测,土地变化类型具体包括未变化类型、耕地变果园类型、耕地变道路类型、裸地变建筑用地类型和其他变化类型。
在本申请实施例中,所述第一预处理具体包括:
根据所述输入数据的极化分解方式提取SAR特征影像,所述输入数据具体为训练双时相SAR数据或双时相SAR数据;
将所述SAR特征影像做对数比值从而获取特征差异影像;
将所述特征差异影像进行标准化;
将进行标准化后的特征差异影像依次进行裁剪和重采样。
具体的,获取研究区的双时相全极化SAR数据后,需要根据不同的极化分解方式提取需要的SAR特征影像,极化方式包括后向散射、Pauli极化分解和Freeman-Durden极化分解pauli极化分解和fereeman-durden极化分解,后向散射特征影像的提取需要对SAR影像依次进行辐射定标、多视处理、地形校正、斑点滤波和分贝值转换操作,Pauli极化分解和Freeman-Durden极化分解特征影像的提取需要对SAR影像依次进行辐射定标、多视处理、地形校正、极化分解和极化滤波等操作。
由于土地变化类型检测是针对同一地区不同时相的遥感影像进行的,故提取SAR特征影像后,需要使用对数比值法来处理前、后时相SAR特征影像从而获取特征差异影像。
因为特征差异影像上的像素值没有量纲,为了避免输入数据混乱导致可能对模型训练造成干扰,需要对特征差异影像进行标准化,也即对所有像素进行0-255的标准化,在具体应用过程中,根据模型,可将差异特征影像裁剪为512×512的图像,重采样为9.5米。
在本申请实施例中,所述第二预处理具体包括:
将所述训练双时相光学数据依次进行辐射标定、大气校正和配准得到一级训练数据;
根据所述一级训练数据制作对应的矢量标签数据;
将所述矢量标签数据中各土地变化类型赋予属性,所述属性包括未变化属性、耕地变果园属性、耕地变道路属性、裸地变建筑用地属性和其他变化属性;
将赋予属性后的矢量标签数据进行栅格化得到对应的单通道标签图像;
将所述单通道标签图像转换为多通道的RGB标签图像;
将所述RGB标签图像进行依次裁剪和重采样。
具体的,在深度学习中,标签数据用于识别原始数据并添加一个或多个有意义的信息标签以提供下文,从而使深度学习模型能够从它进行学习。例如,标签可指示SAR影像包含哪种地物类型,以及具体地物类型变化。
为了让模型能够识别变化类型,将研究区的土地变化类型归类,并对每一类用不同数值进行像素标注。同时为了更加直观的观测不同的土地变化类型,将单通道的带像素数值的栅格图像转化为多通道的RGB图像,就可以通过不同的颜色标注不同的土地变化类型。
为了将标签数据集和影像数据集对应起来,最后也需要对标签图进行裁剪为512×512的图像,重采样为9.5米,在本步骤中即可得到第二训练数据。
在本申请实施例中,最后的识别检测出所述土地变化类型具体包括未变化类型、耕地变果园类型、耕地变道路类型、耕地变建筑用地类型和其他变化类型。
步骤S102、将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络。
在本申请实施例中,所述将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,具体包括:
将所述第一训练数据和第二训练数据进行数据增强处理得到对应的第一增强训练数据和第二增强训练数据;
根据训练、测试和验证之间8:1:1的比例分别对所述第一增强训练数据和第二增强训练数据进行分配;
将分配好的第一增强训练数据和第二增强训练数据输入至所述预设神经网络中进行训练。
具体的,训练中可将每次输入到网络的训练数据的数量设置为2,根据梯度下降的算法进行迭代寻找最优解,将迭代次数设置为400,也即迭代400次结束。为了寻找目标最优解,引入损失函数进行评估,损失函数所表达的是模型的测试值与真实值之间的差异,本发明使用了交叉熵损失函数,交叉熵损失函数能够在梯度很小的情况下继续训练,同时能够加速预设神经网络的收敛,而为了提高预设神经网络的训练速度,通过优化器来持续更新训练参数,本申请中使用Adam优化器,并将其学习率设置为0.01。
在本申请实施例中,所述预设神经网络具体为:将所述注意力模块分别插入所述U-Net网络中编码器每层的卷积之后和池化之前,插入完成后的U-Net网络即为所述预设神经网络,所述预设神经网络包括编码器和解码器,编码器用于特征提取,所述编码器包括反卷积和双线性差值两种上采样,通过跳跃连接融合经过注意力模块的特征图和经过上采样的特征图。
具体的,U-Net网络是一个解码器-编码器结构,编码部分用于特征提取,解码部分用于特征融合,同时,U-Net的跳跃连接将来自解码器的深层高级特征与来自编码器的浅层低级特征相结合,注意力模块也即是Coordinate Attention模块,Coordinate Attention通过嵌入位置信息到通道注意力,从而使移动网络获取更大区域的信息而避免引入大的开销,具体而言,对输入图像分别在x,y两个空间方向进行全局池化操作,生成2个单独的沿垂直和水平方向特征图像。这两个特征图聚合了2个空间方向的特征,这样可以沿一个空间方向捕获远程依赖关系,同时可以沿另一空间方向保留精确的位置信息。然后通过乘法将两个特征图都应用于输入图像,以强调注意区域。Coordinate Attention可以不改变输入图像的大小,只需要将位置权重、通道权重和输入图像相乘,就能得到需要增强关注的区域。
本发明将Coordinate Attention模块也即注意力模块插入到U-Net各层的编码部分,具体在每层的卷积操作之后池化之前,同时保留U-Net解码和跳跃连接,完成这些操作后的U-Net网络即为预设神经网络,预设神经网络的结构可如图3所示。
在预设神经网络的左侧编码部分,从输入开始,每层先对图片也即训练数据或第一数据进行2次3×3卷积,卷积操作能够提取特征图像所含的丰富特征,卷积操作后的图像尺寸不变,通道数发生改变,通道数越多,提取到的图像特征信息就越多。不难看出,1-4层的通道数成2倍增加,最后一层不变,如各层通道数分别为64,128,256,512,512。为了让模型能够学习到重点特征,获取更多细节信息,同时加速模型计算,本发明将CoordinateAttention注意力模块插入到每层卷积之后,经过注意力模块的特征图输入输出大小相同,这样可以让下层的卷积学习到具有空间和通道注意力的特征。经过卷积和注意力模块之后,每层还需要进行1次2×2最大池化,池化会让图片尺寸成2倍减少,该模型一共池化4次。比如说一开始的图片是512×512的,那么经过4次池化就会变成256×256,128×128,64×64,32×32四个不同尺寸的特征图像。可见经过编码部分的图像,从浅层到深层的通道数目和图像大小都发生了变化,这有利于多尺度的提取图像特征。
在预设神经网络的右侧解码部分,自下而上,对编码最后一层输出的32×32的特征图做3×3反卷积和双线性插值,反卷积和双线性插值都可以还原特征图的尺寸大小,得到64×64的特征图。这个特征图与同一层右侧编码部分带有注意力的64×64特征图进行跳跃连接融合特征,然后再对连接之后的特征图做2次3×3卷积再次提取特征和还原通道数。同理为了传递到上层,每层卷积后需要进行3×3反卷积和双线性插值,得到128×128的特征图,然后再次进行跳跃连接、卷积操作。经过一共四次反卷积和双线性插值操作可以得到一个与输入图像尺寸相同的512×512大小的结果图像。
在编码和解码的过程中,为了避免预设神经网络陷入过拟合以及在反向传播更新参数权重的过程中可能出现梯度消失的现象,在各网络层之间加上了BN层和ReLU激活函数。
常用的深度学习网络模型评价指标有准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1、IoU等。本发明使用准确率、精确率、召回率来定量评价模型的变化类型检测结果。其公式表达如下:
Accuracy=(TP+TN)/(TP+TN+FP+FN)
Precision=TP/(TP+FP)
Recall=TP/(TP+FN)
其中TP表示真实类别为正例,网络识别为正例;TN表示真实类别为正例,网络识别为负例;FP表示真实类别为负例,网络识别为正例;FN表示真实类别为正例,网络识别为负例;
经过模型训练,最后本发明网络模型整体的准确度,精确度,召回率都达到了97%,5种变化类型的精确度分别是98.75%,82.84%,70.63%,73.20%,81.30%,召回率分别为98.07%,87.49%,72.82%,84.03%,86.42%。
步骤S103、获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据。
在本申请实施例中,所述第三预处理具体包括:
将所述双时相光学数据依次进行辐射标定、大气校正和配准后得到一级数据;
将所述一级数据依次进行裁剪和重采样。
步骤S104、将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域。
具体的,通过上述训练好的预设神经网络,能够有效地对待检测区域进行土地变化类型识别检测,需要说明的是,训练区域和待检测区域为相同地形地貌特征的区域,例如同为盆地区域、同为平原区域等,在方案扩展中,针对不同地形地貌特征的土地变化类型识别检测,可使用相同地形地貌特征的训练区域,训练完成后即可进行识别检测。
基于上述的基于注意力机制的土地变化类型方法,本说明一个或多个实施例还提供一种土地变化检测的平台、终端,该平台或终端可以包括使用本说明书实施例所述方法的装置、软件、模块、插件、服务器、客户端等并结合必要的实施硬件的装置,基于同一创新构思,本说明书实施例提供的一个或多个实施例中的系统如下面的实施例所述,由于系统解决问题的实施方案与方法类似,因此本说明书实施例具体的系统的实施可以参考前述方法的实施,重复之处不再赘述,以下所使用的术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,软硬件结合的实现也是可能并被构想的。
具体地,图2是本说明书提供的基于注意力机制的土地变化类型检测装置一个实施例的模块结构示意图,如图2所示,本说明书中提供的基于注意力机制的土地变化类型检测装置包括:
第一获取模块201,用于获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;
预处理模块202,用于将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据;
训练模块203,用于将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络;
第二获取模块204,用于获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据;
识别检测模块205,用于将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域。
需要说明的是,上述的系统根据对应方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照上述对应的方法实施例的描述,在此不作一一赘述。
本申请实施例还提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器被配置为用于执行如上述实施例提供的方法。
本申请实施例提供的电子设备,通过存储器存储处理器的可执行指令,当处理器执行该可执行指令时,能够先获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据;将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络;获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据;将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域,实现了快速准确地对土地变化类型进行检测,且无需复杂方程式,其适用性较高。
本说明书实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图4是本说明书一个实施例中基于注意力机制的土地变化类型检测服务器的硬件结构框图,该计算机终端可以是上述实施例中的基于注意力机制的土地变化类型检测服务器或基于注意力机制的土地变化类型检测装置。可以包括一个或多个(图中仅示出一个)处理器100(处理器100可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的非易失性存储器200、以及用于通信功能的传输模块300。
非易失性存储器200可用于存储应用软件的软件程序以及模块,如本说明书实施例中的数据安全访问方法对应的程序指令/模块,处理器100通过运行存储在非易失性存储器200内的软件程序以及模块,从而执行各种功能应用以及资源数据更新。非易失性存储器200可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,非易失性存储器200可进一步包括相对于处理器100远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输模块300用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输模块300包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块300可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书提供的上述实施例所述的方法或装置可以通过计算机程序实现业务逻辑并记录在存储介质上,所述的存储介质可以计算机读取并执行,实现本说明书实施例所描述方案的效果,如:
获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;
将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据;
将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络;
获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据;
将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域。
所述存储介质可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。所述存储介质有可以包括:利用电能方式存储信息的装置如,各式存储器,如ram、rom等;利用磁能方式存储信息的装置如,硬盘、软盘、磁带、磁芯存储器、磁泡存储器、u盘;利用光学方式存储信息的装置如,cd或dvd。当然,还有其他方式的可读存储介质,例如量子存储器、石墨烯存储器等等。
本说明书实施例并不局限于必须是符合行业通信标准、标准计算机资源数据更新和数据存储规则或本说明书一个或多个实施例所描述的情况。某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、存储、判断、处理方式等获取的实施例,仍然可以属于本说明书实施例的可选实施方案范围之内。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc 625d、atmel at91sam、microchip pic18f26k20以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或插件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
这些计算机程序指令也可装载到计算机或其他可编程资源数据更新设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参考即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参考方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (9)

1.一种基于注意力机制的土地变化类型检测方法,其特征在于,所述方法包括:
获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;
将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据;
将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络;
获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据;
将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域。
2.如权利要求1所述的基于注意力机制的土地变化类型检测方法,其特征在于,所述土地变化类型具体包括未变化类型、耕地变果园类型、耕地变道路类型、裸地变建筑用地类型和其他变化类型。
3.如权利要求1所述的基于注意力机制的土地变化类型检测方法,其特征在于,所述预设神经网络具体为:将所述注意力模块分别插入所述U-Net网络中编码器每层的卷积之后和池化之前,插入完成后的U-Net网络即为所述预设神经网络,所述预设神经网络包括编码器和解码器,编码器用于特征提取,所述编码器包括反卷积和双线性差值两种上采样,通过跳跃连接融合经过注意力模块的特征图和经过上采样的特征图。
4.如权利要求1所述的基于注意力机制的土地变化类型检测方法,其特征在于,所述双时相SAR数据和训练双时相SAR数据均为双时相全极化SAR数据,所述第一预处理具体包括:
根据所述输入数据的极化分解方式提取SAR特征影像,所述输入数据具体为训练双时相SAR数据或双时相SAR数据;
将所述SAR特征影像做对数比值从而获取特征差异影像;
将所述特征差异影像进行标准化;
将进行标准化后的特征差异影像依次进行裁剪和重采样。
5.如权利要求1所述的基于注意力机制的土地变化类型检测方法,其特征在于,所述第二预处理具体包括:
将所述训练双时相光学数据依次进行辐射标定、大气校正和配准得到一级训练数据;
根据所述一级训练数据制作对应的矢量标签数据;
将所述矢量标签数据中各土地变化类型赋予属性,所述属性包括未变化属性、耕地变果园属性、耕地变道路属性、裸地变建筑用地属性和其他变化属性;
将赋予属性后的矢量标签数据进行栅格化得到对应的单通道标签图像;
将所述单通道标签图像转换为多通道的RGB标签图像;
将所述RGB标签图像进行依次裁剪和重采样。
6.如权利要求1所述的基于注意力机制的土地变化类型检测方法,其特征在于,所述第三预处理具体包括:
将所述双时相光学数据依次进行辐射标定、大气校正和配准后得到一级数据;
将所述一级数据依次进行裁剪和重采样。
7.如权利要求1所述的基于注意力机制的土地变化类型检测方法,其特征在于,所述将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,具体包括:
将所述第一训练数据和第二训练数据进行数据增强处理得到对应的第一增强训练数据和第二增强训练数据;
根据训练、测试和验证之间8:1:1的比例分别对所述第一增强训练数据和第二增强训练数据进行分配;
将分配好的第一增强训练数据和第二增强训练数据输入至所述预设神经网络中进行训练。
8.一种基于注意力机制的土地变化类型检测装置,其特征在于,所述装置包括:
第一获取模块,用于获取训练区域的训练双时相SAR数据和训练双时相光学数据,所述训练双时相SAR数据和训练双时相光学数据是一一对应的;
预处理模块,用于将所述训练双时相SAR数据进行第一预处理得到第一训练数据,将所述训练双时相光学数据进行第二预处理得到第二训练数据;
训练模块,用于将所述第一训练数据和第二训练数据输入至预设神经网络中进行训练,其中,所述预设神经网络为基于注意力模块和U-Net网络建立的神经网络;
第二获取模块,用于获取待检测区域的双时相SAR数据和双时相光学数据,并将所述双时相SAR数据进行所述第一预处理得到第一数据,将所述双时相光学数据进行第三预处理得到第二数据;
识别检测模块,用于将所述第一数据和第二数据输入至训练好的预设神经网络中,从而得到土地变化类型识别检测结果,其中,所述训练区域和所述待检测区域为相同地形地貌特征的区域。
9.如权利要求8所述的基于注意力机制的土地变化类型检测方法,其特征在于,所述预设神经网络具体为:将所述注意力模块分别插入所述U-Net网络中编码器每层的卷积之后和池化之前,插入完成后的U-Net网络即为所述预设神经网络,所述预设神经网络包括编码器和解码器,编码器用于特征提取,所述编码器包括反卷积和双线性差值两种上采样,通过跳跃连接融合经过注意力模块的特征图和经过上采样的特征图。
CN202211542600.1A 2022-12-02 2022-12-02 一种基于注意力机制的土地变化类型检测方法及装置 Active CN116152669B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211542600.1A CN116152669B (zh) 2022-12-02 2022-12-02 一种基于注意力机制的土地变化类型检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211542600.1A CN116152669B (zh) 2022-12-02 2022-12-02 一种基于注意力机制的土地变化类型检测方法及装置

Publications (2)

Publication Number Publication Date
CN116152669A true CN116152669A (zh) 2023-05-23
CN116152669B CN116152669B (zh) 2025-07-15

Family

ID=86353381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211542600.1A Active CN116152669B (zh) 2022-12-02 2022-12-02 一种基于注意力机制的土地变化类型检测方法及装置

Country Status (1)

Country Link
CN (1) CN116152669B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119810632A (zh) * 2024-11-08 2025-04-11 北京观微科技有限公司 建筑变化区域检测方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110222781A1 (en) * 2010-03-15 2011-09-15 U.S. Government As Represented By The Secretary Of The Army Method and system for image registration and change detection
CN114419430A (zh) * 2021-12-09 2022-04-29 华南农业大学 一种基于SE-U-Net++模型的耕地地块提取方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110222781A1 (en) * 2010-03-15 2011-09-15 U.S. Government As Represented By The Secretary Of The Army Method and system for image registration and change detection
CN114419430A (zh) * 2021-12-09 2022-04-29 华南农业大学 一种基于SE-U-Net++模型的耕地地块提取方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YUXING CHEN等: "Self-Supervised Change Detection by Fusing SAR and Optical Multi-Temporal Images", 《2021 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM IGARSS》, 12 October 2021 (2021-10-12) *
李向秀: "基于可见光与SAR协同地物分类的应用研究", 《中国优秀硕士学位论文全文数据库_工程科技Ⅱ辑》, 15 March 2022 (2022-03-15), pages 028 - 215 *
翟鹏飞等: "协同光学与雷达遥感数据的面向对象土地覆盖变化检测", 《农业工程学报》, vol. 37, no. 23, 8 December 2021 (2021-12-08), pages 216 - 224 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119810632A (zh) * 2024-11-08 2025-04-11 北京观微科技有限公司 建筑变化区域检测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN116152669B (zh) 2025-07-15

Similar Documents

Publication Publication Date Title
CN113591566B (zh) 图像识别模型的训练方法、装置、电子设备和存储介质
CN113673400A (zh) 基于深度学习的实景三维语义重建方法、装置及存储介质
CN108229300A (zh) 视频分类方法、装置、计算机可读存储介质和电子设备
Song et al. Extraction and reconstruction of curved surface buildings by contour clustering using airborne LiDAR data
Shit et al. An encoder‐decoder based CNN architecture using end to end dehaze and detection network for proper image visualization and detection
CN119941731B (zh) 基于大模型的肺结节分析方法、系统、设备及介质
CN117011692A (zh) 一种道路识别的方法以及相关装置
CN117911970A (zh) 点云道路要素目标提取方法、装置、电子设备及存储介质
CN115953330B (zh) 虚拟场景图像的纹理优化方法、装置、设备和存储介质
CN116152669A (zh) 一种基于注意力机制的土地变化类型检测方法及装置
CN114332809A (zh) 一种图像识别方法、装置、电子设备和存储介质
CN118644667B (zh) 基于深度学习的轮毂表面缺陷检测的方法和装置
CN104598906A (zh) 车辆外轮廓检测方法及其装置
CN118115716B (zh) 一种融合视觉和ar技术的高精度定位方法
CN113034420B (zh) 一种频率空间域特征的工业产品表面缺陷分割方法及系统
CN116805410B (zh) 三维目标检测方法、系统及电子设备
CN119399716A (zh) 基于多传感器融合的目标检测方法、系统、设备及介质
CN103955936B (zh) 一种基于堆栈式去噪自编码机的显著性物体检测方法
CN118967562A (zh) 一种基于深度学习的危岩体裂缝检测方法、系统、装置和及存储介质
CN117078997A (zh) 图像处理或图像处理模型的训练方法、装置、设备及介质
CN112651351B (zh) 一种数据处理的方法和装置
CN116994306A (zh) 关键点检测模型训练方法、装置、电子设备及存储介质
CN119181011B (zh) 自适应多尺度特征融合的图像识别方法、装置、设备及存储介质
CN118072354B (zh) 行人重识别方法、装置、电子设备和计算机可读介质
CN118196677B (zh) 视频内容的识别方法、系统、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant