[go: up one dir, main page]

CN111860637A - 一种单发多框红外目标检测方法 - Google Patents

一种单发多框红外目标检测方法 Download PDF

Info

Publication number
CN111860637A
CN111860637A CN202010689129.3A CN202010689129A CN111860637A CN 111860637 A CN111860637 A CN 111860637A CN 202010689129 A CN202010689129 A CN 202010689129A CN 111860637 A CN111860637 A CN 111860637A
Authority
CN
China
Prior art keywords
feature
network
scale
fusion
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010689129.3A
Other languages
English (en)
Other versions
CN111860637B (zh
Inventor
刘刚
刘森
刘中华
肖春宝
曹紫绚
张文波
张培根
许来祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Science and Technology
Original Assignee
Henan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Science and Technology filed Critical Henan University of Science and Technology
Priority to CN202010689129.3A priority Critical patent/CN111860637B/zh
Publication of CN111860637A publication Critical patent/CN111860637A/zh
Application granted granted Critical
Publication of CN111860637B publication Critical patent/CN111860637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

一种单发多框红外目标检测方法,从特征金字塔网络出发,基于可学习的权值刻画各特征层对融合输出贡献的不平等性,实现低分辨率、强语义的特征层与高分辨率、弱语义特征层间的双向多尺度特征加权融合,构造出辅助网络;从交并比出发,同时考虑重叠区域与非重叠区域对目标函数的影响,构造对目标尺度变化保持不变性的检测器定位损失,构造出目标检测器,提高检测模型对小目标定位误差的敏感性。以VGG16卷积神经网络作为特征提取网络并与辅助网络、目标检测器集成,形成融合多尺度特征加权融合与尺度不变性定位损失的单发多框红外目标检测模型。本发明具备自主学习能力且检测率高,是解决复杂环境下红外成像制导目标检测问题的有效途径。

Description

一种单发多框红外目标检测方法
技术领域
本发明属于红外目标检测技术领域,具体涉及一种单发多框红外目标检测方法。
背景技术
目前,目标检测是红外成像制导自动目标识别系统完成识别、跟踪等后续任务的基础,已有系统不具备目标特征的自主学习能力,任务环境一旦超出预先规划的条件将无能为力。基于深度学习的单阶段目标检测具备自主学习能力且计算效率高,是解决复杂环境下红外成像制导目标检测问题的有效途径。单发多框检测器(Single Shot MultiBoxDetector,SSD)是经典的单阶段检测模型。SSD目标检测模型可分解为特征提取器和目标检测器两个模块。特征提取器负责从输入图像中提取特征,目标检测器则利用抽取的特征对目标位置和类别进行预测。特征提取器包含两部分:特征提取网络和辅助网络。特征提取网络一般由图像分类网络改造而成,这样可以利用在图像分类数据集上预训练的权重,实现迁移学习效果。辅助网络用于对特征提取网络输出的特征进行变换、融合等操作。目标检测器由若干全连接层或卷积层构成,每个全连接层或者卷积层可看作若干检测器的集合。每个检测器只能输出一个检测结果,检测器的数量决定算法可检测目标数量的上限。每个检测器由1个定位器和1个分类器组成。定位器负责将输入特征映射为目标位置信息,分类器负责将输入特征映射为目标类别信息。
目前,基于SSD模型进行红外成像制导目标检测主要存在两个挑战:(1)有效地表示和处理多尺度特征是SSD模型特征提取器设计的一个主要难点。尽管已有方法通过改进多尺度特征的表示和融合方法提高了单阶段模型对于目标特别是小目标的检测能力,但由于不同尺度特征层连接形式的单一性、融合方式的平等性,使得单阶段模型的检测能力还有较大的提升空间。研究更高效的特征选择和融合机制,实现低分辨率、强语义的特征层与高分辨率、弱语义特征层的融合是提升红外小目标检测能力的一个关键思路;(2)SSD模型的目标检测器定位损失一般采用L1、L2损失函数来计算,没有考虑目标尺度变化对损失函数的影响,但对于同样的尺寸误差,小目标显然比大目标更敏感,这降低了模型对小目标定位误差的敏感性。
发明内容
有鉴于此,为解决上述现有技术的不足,本发明的目的在于提供了一种单发多框红外目标检测方法,融合多尺度特征加权融合与尺度不变性定位损失,具备自主学习能力且检测率高,是解决复杂环境下红外成像制导目标检测问题的有效途径。
为实现上述目的,本发明所采用的技术方案是:
一种单发多框红外目标检测方法,包括以下步骤:
S1:从特征金字塔网络出发,基于可学习的权值刻画各特征层对融合输出贡献的不平等性,实现低分辨率、强语义的特征层与高分辨率、弱语义特征层间的双向多尺度特征加权融合,构建辅助网络;
S2:从交并比出发,同时考虑重叠区域与非重叠区域对目标函数的影响,构造对目标尺度变化保持不变性的检测器定位损失,构建目标检测器;
S3:以VGG16卷积神经网络作为特征提取网络并与辅助网络、目标检测器集成,形成融合多尺度特征加权融合与尺度不变性定位损失的单发多框红外目标检测模型;
S31:在特征融合过程中为每个输入特征添加一个表征其重要性的权值,并通过网络训练学习输入特征的重要性;
S32:集成多尺度双向跳跃连接和快速归一化加权特征融合,作为一个功能网络层并重复多次,构造出双向特征加权融合金字塔网络,作为辅助网络;
S33:关注重叠区域与非重叠区域对目标函数的影响,融入对目标尺度变化保持不变性的因素,构造检测器定位损失;
S34:特征提取网络,结合辅助网络,以及目标检测器,构成实现融合多尺度特征加权融合与尺度不变性定位损失的单发多框红外目标检测模型。
进一步的,所述步骤S1具体包括:从特征金字塔网络(Feature Pyramid Network,FPN)自上而下的融合多尺度特征的思路出发,在FPN上添加一个自下而上的路径进一步融合特征,形成双向路径;在此基础上,如果节点只有一条输入边且没有特征融合,则它对特征融合网络的贡献较小,将其移除;为处于同一级别的非相邻节点增加一个跳跃连接,在不增加成本的情况下融合更多特征;另外,为实现更高层次的特征融合,将双向路径作为一个功能网络层并重复多次。
进一步的,所述步骤S1中的双向多尺度特征加权融合,具体包括以下步骤:
在特征融合过程中为每个输入特征添加一个表征其重要性的权值,并通过网络训练学习输入特征的重要性,加权融合方程如下:
Figure BDA0002588684090000041
这里ωi是一个可学习的权值,Fi是当前层第i个输入特征,在每一个ωi之后应用Relu以确保ωi>0,
Figure BDA0002588684090000042
为当前层各个输入特征的权值和,ε是常数。
进一步的,所述步骤S2中,构造对目标尺度变化保持不变性的检测器定位损失,具体包括以下步骤:
从交并比(Intersection over Union,IoU)出发,构造对目标尺度变化保持不变性的定位器损失:
Lloc=1-GIoC;
Figure BDA0002588684090000043
其中,A和B分别是预测锚框和真实锚框,C是两者的闭包;重叠区域最重要的是预测锚框与真实锚框的交集区域,非重叠区域最重要的是闭包C中去除预测锚框与真实锚框并集的区域,去除交集区域的并集部分则是次要影响非重叠区域;GIoC同时关注重叠区域与非重叠区域对目标函数的影响且计算量更小。
进一步的,所述步骤S3中的VGG16卷积神经网络包括:13个卷积层、5个池化层、2个全连接层,VGG16卷积神经网络构造单发多框检测器的特征提取网络。
本发明的有益效果是:
本发明的一种单发多框红外目标检测方法,融合多尺度特征加权融合与尺度不变性定位损失,具备自主学习能力且检测率高,是解决复杂环境下红外成像制导目标检测问题的有效途径;
本发明从特征金字塔网络出发,基于可学习的权值刻画各特征层对融合输出贡献的不平等性,实现低分辨率、强语义的特征层与高分辨率、弱语义特征层间的双向多尺度特征加权融合;从交并比出发,同时考虑重叠区域与非重叠区域对目标函数的影响,构造对目标尺度变化保持不变性的检测器定位损失,提高检测模型对小目标定位误差的敏感性。本发明模型具备自主学习能力且检测率高,是解决复杂环境下红外成像制导目标检测问题的有效途径。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的多尺度特征层连接策略示意图;
图2为本发明的训练集和验证集损失变化示意图;
图3为本发明的红外目标P-R曲线的AP变化值示意图。
具体实施方式
下面给出具体实施例,对本发明的技术方案作进一步清楚、完整、详细地说明。本实施例是以本发明技术方案为前提的最佳实施例,但本发明的保护范围不限于下述的实施例。
一种单发多框红外目标检测方法,包括以下步骤:
S1:从特征金字塔网络出发,基于可学习的权值刻画各特征层对融合输出贡献的不平等性,实现低分辨率、强语义的特征层与高分辨率、弱语义特征层间的双向多尺度特征加权融合,构建辅助网络;
S2:从交并比出发,同时考虑重叠区域与非重叠区域对目标函数的影响,构造对目标尺度变化保持不变性的检测器定位损失,构建目标检测器;提高检测模型对小目标定位误差的敏感性;
S3:以VGG16卷积神经网络作为特征提取网络并与辅助网络、目标检测器集成,形成融合多尺度特征加权融合与尺度不变性定位损失的单发多框红外目标检测模型;
S31:在特征融合过程中为每个输入特征添加一个表征其重要性的权值,并通过网络训练学习输入特征的重要性;
S32:集成多尺度双向跳跃连接和快速归一化加权特征融合,作为一个功能网络层并重复多次,构造出双向特征加权融合金字塔网络,作为辅助网络;
S33:关注重叠区域与非重叠区域对目标函数的影响,融入对目标尺度变化保持不变性的因素,构造检测器定位损失;
为了提高单阶段模型的小目标检测能力,应该在检测器定位损失函数中融入对目标尺度变化保持不变性的因素,交并比IoU对目标尺度变化具有不变性:
Figure BDA0002588684090000071
A和B分别是预测锚框和真实锚框;
但是IoU只关注预测锚框和真实锚框的重叠区域,为了能更好的反映预测框与真实框的重合度,还需要关注其他的非重合区域。基于此,本发明对IoU进行改进:
Figure BDA0002588684090000072
C是预测锚框和真实锚框的闭包。重叠区域最重要的是预测框与真实框的交集区域,非重叠区域最重要的是闭包C中去除预测框与真实框并集的区域,去除交集区域的并集部分则是次要影响非重叠区域,GIoC同时反映重叠区域与非重叠区域;
基于GIoC的对目标尺度变化保持不变性的检测器定位损失可设计为:
Lloc=1-GIoC;
S34:特征提取网络,结合辅助网络,以及目标检测器,构成实现融合多尺度特征加权融合与尺度不变性定位损失的单发多框红外目标检测模型。批大小为32,迭代20万次。初始的学习率设置为0.001,在迭代到5万次、10万次和15万次时分别除以10,利用动量值为0.9和权重衰减参数为0.0005的随机梯度下降进行网络优化。
进一步的,由于经典的SSD单阶段目标检测网络中,靠近底层的特征往往语义信息比较少,但位置信息丰富;靠近顶层的特征语义信息比较丰富,但位置信息较粗略。为提高对红外小目标的检测率,本发明从FPN着手,对不同尺度的特征层进行融合。进一步的,作为优化方案,步骤S1为构建双向跳跃连接FPN。所述步骤S1具体包括:从特征金字塔网络(Feature Pyramid Network,FPN)自上而下的融合多尺度特征的思路出发,在FPN上添加一个自下而上的路径进一步融合特征,形成双向路径;在此基础上,如果节点只有一条输入边且没有特征融合,则它对特征融合网络的贡献较小,将其移除;为处于同一级别的非相邻节点增加一个跳跃连接,在不增加成本的情况下融合更多特征;另外,为实现更高层次的特征融合,将双向路径作为一个功能网络层并重复多次。进一步的,在FPN上添加一个自下而上的路径进一步融合特征;如果节点只有一条输入边且没有特征融合,那么它对特征融合网络的贡献较小,可以移除;为处于同一级别的非相邻节点增加一个跳跃连接,这样可在不增加成本的情况下融合更多特征,进而实现双向跳跃连接FPN。双向跳跃连接FPN的结构如图1(d)所示。
进一步的,所述步骤S1中的双向多尺度特征加权融合,具体包括以下步骤:
考虑到不同的输入特征具有不同的分辨率,它们对输出特征的贡献往往不相等;在特征融合过程中为每个输入特征添加一个表征其重要性的权值,并通过网络训练学习输入特征的重要性,加权融合方程如下:
Figure BDA0002588684090000081
这里ωi是一个可学习的权值,Fi是当前层第i个输入特征,在每一个ωi之后应用Relu以确保ωi>0,
Figure BDA0002588684090000091
为当前层各个输入特征的权值和,ε是常数,它一个小值(如0.0001)以避免数值不稳定。结合图1(d),第6层的融合过程可描述为:
Figure BDA0002588684090000092
Figure BDA0002588684090000093
这里
Figure BDA0002588684090000094
是初始第6层特征,
Figure BDA0002588684090000095
是自上而下通路6级中间特征,
Figure BDA0002588684090000096
是自下而上通路的6级输出特征。Resize为适应分辨率匹配的上采样或下采样运算,Conv是特征处理的卷积运算。所有其他层特征以相似方式融合。
进一步的,所述步骤S2中,构造对目标尺度变化保持不变性的检测器定位损失,具体包括以下步骤:
从交并比(Intersection over Union,IoU)出发,构造对目标尺度变化保持不变性的定位器损失:
Lloc=1-GIoC;
Figure BDA0002588684090000097
其中,A和B分别是预测锚框和真实锚框,C是两者的闭包;重叠区域最重要的是预测锚框与真实锚框的交集区域,非重叠区域最重要的是闭包C中去除预测锚框与真实锚框并集的区域,去除交集区域的并集部分则是次要影响非重叠区域;GIoC同时关注重叠区域与非重叠区域对目标函数的影响且计算量更小。
进一步的,所述步骤S3中的VGG16卷积神经网络包括:13个卷积层、5个池化层、2个全连接层,VGG16卷积神经网络构造单发多框检测器的特征提取网络。
进一步的,接上述步骤S34结束后,本实施例中,下面通过仿真实验验证本发明的效果:
1.Pascal Voc数据集
在PASCAL VOC数据集中选voc2007+voc2012中的训练数据部分为训练集,在VOC2007测试数据集上做测试。以在ImageNet数据集中预训练的VGG16作为本发明的主干网络,将本发明模型命名为WFSSD,分别在输入图像尺寸为300×300和521×512下与SSD、DSSD、RSSD和FSSD进行对比,结果如表1所示;
表1 PASCAL VOC2007测试集检测结果
Figure BDA0002588684090000101
从表1可以看出,WFSSD300的mAP达到了84.7%,相对于SSD300提高了7.2个百分点;WFSSD512的mAP达到了86.6%,相对于SSD512提高了7.1个百分点。尽管DSSD的特征提取网络采用的是性能更好的ResNet-101,本发明模型的mAP结果仍然高于DSSD。由于RSSD、FSSD这两种改进SSD模型在高、低特征层融合时均没有考虑特征层对于融合输出的贡献程度的不同,是简单的非加权叠加;而本发明则对不同特征层按照采用基于可学习的加权融合方式,且在检测器中引入对目标尺度变换具备不变性的损失,故实现了检测性能的超越。在速度方面,WFSSD模型与SSD相差不大;尽管YOLOv3有着更快的检测速度,但在准确率方面与本发明模型差距明显。
2.消融实验
双向特征加权融合金字塔网络和目标尺度不变性GIoC定位损失是本发明提出的两个创新点,为分析它们对于WFSSD模型性能提升的贡献程度,做消融实验结果如表2所示;
表2不同组件对本发明模型检测性能的影响
Figure BDA0002588684090000111
从表2可看出,双向特征加权融合金字塔网络和目标尺度不变性GIoC定位损失分别从特征提取器的辅助网络、定位器损失两方面对本发明模型的性能施加了影响,且双向特征加权融合金字塔网络的影响程度更大。
3.自建红外数据集
实验数据来源为红外飞机视频,按帧保存共有5582帧(352×240)。按飞行姿态将目标分为三种类别:侧向、后向、背向,检测时区分机身和尾焰,人工标注的目标类别共有6种:背向机身(Back Fuselage,BAF)、背向尾焰(Back Tail flame,BAT)、侧向机身(LateralFuselage,LAF)、侧向尾焰(Lateral Tail flame,LAT)、后向机身(Backward Fuselage,BWF)、后向尾焰(Backward Tail flame,BWT)。数据集中人工标记的六种类别的目标数量总量为19936,分布为:BAF 3385、BAT 2730、LAF 6438、LAT4904、BWF 352、BWT 2127,分布不均衡,训练时使用了基于几何变换的数据增广方法来增大样本量以弥补这一缺陷。
WFSSD300模型的训练和验证损失变化曲线如图2所示,可以看出,模型对于训练集的损失变化不断地减小,而对应的验证集的损失值变化也逐渐降低,最终趋于稳定收敛状态。训练参数同Pascal Voc数据集,测试集的AP和mAP结果如表3所示,WFSSD在检测精度方面超越了SSD、DSSD、RSSD和FSSD。
表3红外数据集检测结果
Figure BDA0002588684090000121
6类数据测试的准确率(precision)和召回率(recall)曲线与AP值关系如图3所示。
将人工标记的19936个目标在训练好的模型上进行测试,测试结果分三种情况:True为检测到且正确分类,False为检测到但分类错误,Miss表示没有检测到,结果(百分比)如表4所示。在原始图像中标记框长宽均小于50个像素的目标共有13785个,占总目标的69.6%,这些目标的检测结果如表5所示。在原始图像中标记框长宽均小于25个像素的目标共有7666个,占总目标的38.45%,这些目标的检测结果如表6所示。在原始图像中标记框长宽均小于12个像素的目标共有1402个,占总目标的7.03%,检测结果如表7所示;
表4小目标检测能力对比(ALL)
Figure BDA0002588684090000131
表5小目标检测能力对比(<50)
Figure BDA0002588684090000132
表6小目标检测能力对比(<25)
Figure BDA0002588684090000133
表7小目标检测能力对比(<12)
Figure BDA0002588684090000134
由表4-表7可看出,随着目标尺寸变小,传统SSD和WFSSD正确检测(True)到目标所占比例都在降低,漏检比例(Miss)都在升高。在同一尺寸下,WFSSD的两个指标均优于传统及其他改进SSD,随尺寸变小,这种优势显著增大。WFSSD能够检测到更多的小目标,得益于特征加权融合。
综上所述,本发明从特征金字塔网络出发,基于可学习的权值刻画各特征层对融合输出贡献的不平等性,实现低分辨率、强语义的特征层与高分辨率、弱语义特征层间的双向多尺度特征加权融合;从交并比出发,同时考虑重叠区域与非重叠区域对目标函数的影响,构造对目标尺度变化保持不变性的检测器定位损失,提高检测模型对小目标定位误差的敏感性。本发明模型具备自主学习能力且检测率高,是解决复杂环境下红外成像制导目标检测问题的有效途径。
以上显示和描述了本发明的主要特征、基本原理以及本发明的优点。本行业技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会根据实际情况有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (5)

1.一种单发多框红外目标检测方法,其特征在于:包括以下步骤:
S1:从特征金字塔网络出发,基于可学习的权值刻画各特征层对融合输出贡献的不平等性,实现低分辨率、强语义的特征层与高分辨率、弱语义特征层间的双向多尺度特征加权融合,构建辅助网络;
S2:从交并比出发,同时考虑重叠区域与非重叠区域对目标函数的影响,构造对目标尺度变化保持不变性的检测器定位损失,构建目标检测器;
S3:以VGG16卷积神经网络作为特征提取网络并与辅助网络、目标检测器集成,形成融合多尺度特征加权融合与尺度不变性定位损失的单发多框红外目标检测模型;
S31:在特征融合过程中为每个输入特征添加一个表征其重要性的权值,并通过网络训练学习输入特征的重要性;
S32:集成多尺度双向跳跃连接和快速归一化加权特征融合,作为一个功能网络层并重复多次,构造出双向特征加权融合金字塔网络,作为辅助网络;
S33:关注重叠区域与非重叠区域对目标函数的影响,融入对目标尺度变化保持不变性的因素,构造检测器定位损失;
S34:特征提取网络,结合辅助网络,以及目标检测器,构成实现融合多尺度特征加权融合与尺度不变性定位损失的单发多框红外目标检测模型。
2.根据权利要求1所述的一种单发多框红外目标检测方法,其特征在于:所述步骤S1具体包括:从特征金字塔网络(Feature Pyramid Network,FPN)自上而下的融合多尺度特征的思路出发,在FPN上添加一个自下而上的路径进一步融合特征,形成双向路径;在此基础上,如果节点只有一条输入边且没有特征融合,则它对特征融合网络的贡献较小,将其移除;为处于同一级别的非相邻节点增加一个跳跃连接,在不增加成本的情况下融合更多特征;另外,为实现更高层次的特征融合,将双向路径作为一个功能网络层并重复多次。
3.根据权利要求1所述的一种单发多框红外目标检测方法,其特征在于:所述步骤S1中的双向多尺度特征加权融合,具体包括以下步骤:
在特征融合过程中为每个输入特征添加一个表征其重要性的权值,并通过网络训练学习输入特征的重要性,加权融合方程如下:
Figure FDA0002588684080000021
这里ωi是一个可学习的权值,Fi是当前层第i个输入特征,在每一个ωi之后应用Relu以确保ωi>0,
Figure FDA0002588684080000022
为当前层各个输入特征的权值和,ε是常数。
4.根据权利要求1所述的一种单发多框红外目标检测方法,其特征在于:所述步骤S2中,构造对目标尺度变化保持不变性的检测器定位损失,具体包括以下步骤:
从交并比(Intersection overUnion,IoU)出发,构造对目标尺度变化保持不变性的定位器损失:
Lloc=1-GIoC;
Figure FDA0002588684080000031
其中,A和B分别是预测锚框和真实锚框,C是两者的闭包;重叠区域最重要的是预测锚框与真实锚框的交集区域,非重叠区域最重要的是闭包C中去除预测锚框与真实锚框并集的区域,去除交集区域的并集部分则是次要影响非重叠区域;GIoC同时关注重叠区域与非重叠区域对目标函数的影响且计算量更小。
5.根据权利要求1所述的一种单发多框红外目标检测方法,其特征在于:所述步骤S3中的VGG16卷积神经网络包括:13个卷积层、5个池化层、2个全连接层,VGG16卷积神经网络构造单发多框检测器的特征提取网络。
CN202010689129.3A 2020-07-17 2020-07-17 一种单发多框红外目标检测方法 Active CN111860637B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010689129.3A CN111860637B (zh) 2020-07-17 2020-07-17 一种单发多框红外目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010689129.3A CN111860637B (zh) 2020-07-17 2020-07-17 一种单发多框红外目标检测方法

Publications (2)

Publication Number Publication Date
CN111860637A true CN111860637A (zh) 2020-10-30
CN111860637B CN111860637B (zh) 2023-11-21

Family

ID=72983197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010689129.3A Active CN111860637B (zh) 2020-07-17 2020-07-17 一种单发多框红外目标检测方法

Country Status (1)

Country Link
CN (1) CN111860637B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112270366A (zh) * 2020-11-02 2021-01-26 重庆邮电大学 基于自适应多特征融合的微小目标检测方法
CN112560853A (zh) * 2020-12-14 2021-03-26 中科云谷科技有限公司 图像处理的方法、装置及存储介质
CN113012228A (zh) * 2021-03-23 2021-06-22 华南理工大学 一种工位定位系统及基于深度学习的工件定位方法
CN115512207A (zh) * 2022-11-01 2022-12-23 安徽南瑞继远电网技术有限公司 一种基于多路特征融合及高阶损失感知采样的单阶段目标检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563433A (zh) * 2017-08-29 2018-01-09 电子科技大学 一种基于卷积神经网络的红外小目标检测方法
CN109034210A (zh) * 2018-07-04 2018-12-18 国家新闻出版广电总局广播科学研究院 基于超特征融合与多尺度金字塔网络的目标检测方法
CN109344821A (zh) * 2018-08-30 2019-02-15 西安电子科技大学 基于特征融合和深度学习的小目标检测方法
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN110826554A (zh) * 2018-08-10 2020-02-21 西安电子科技大学 一种红外目标检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563433A (zh) * 2017-08-29 2018-01-09 电子科技大学 一种基于卷积神经网络的红外小目标检测方法
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN109034210A (zh) * 2018-07-04 2018-12-18 国家新闻出版广电总局广播科学研究院 基于超特征融合与多尺度金字塔网络的目标检测方法
CN110826554A (zh) * 2018-08-10 2020-02-21 西安电子科技大学 一种红外目标检测方法
CN109344821A (zh) * 2018-08-30 2019-02-15 西安电子科技大学 基于特征融合和深度学习的小目标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘涛;汪西莉;: "采用卷积核金字塔和空洞卷积的单阶段目标检测", 中国图象图形学报, no. 01 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112270366A (zh) * 2020-11-02 2021-01-26 重庆邮电大学 基于自适应多特征融合的微小目标检测方法
CN112560853A (zh) * 2020-12-14 2021-03-26 中科云谷科技有限公司 图像处理的方法、装置及存储介质
CN113012228A (zh) * 2021-03-23 2021-06-22 华南理工大学 一种工位定位系统及基于深度学习的工件定位方法
CN113012228B (zh) * 2021-03-23 2023-06-20 华南理工大学 一种工件定位系统及基于深度学习的工件定位方法
CN115512207A (zh) * 2022-11-01 2022-12-23 安徽南瑞继远电网技术有限公司 一种基于多路特征融合及高阶损失感知采样的单阶段目标检测方法

Also Published As

Publication number Publication date
CN111860637B (zh) 2023-11-21

Similar Documents

Publication Publication Date Title
CN109961089B (zh) 基于度量学习和元学习的小样本和零样本图像分类方法
CN114694002B (zh) 一种基于特征融合与注意力机制的红外目标检测方法
Francies et al. A robust multiclass 3D object recognition based on modern YOLO deep learning algorithms
CN111860637B (zh) 一种单发多框红外目标检测方法
CN106980858B (zh) 一种语言文本检测与定位系统及应用该系统的语言文本检测与定位方法
CN110427836B (zh) 一种基于多尺度优化的高分辨率遥感影像水体提取方法
CN113420607A (zh) 无人机多尺度目标检测识别方法
CN114764886B (zh) 基于cfar指导的双流ssd sar图像目标检测方法
CN110163117A (zh) 一种基于自激励判别性特征学习的行人重识别方法
CN114676776A (zh) 一种基于Transformer的细粒度图像分类方法
Liu et al. A shadow detection algorithm based on multiscale spatial attention mechanism for aerial remote sensing images
CN117520589B (zh) 一种局部特征与全局特征融合的跨模态遥感图文检索方法
CN117853955A (zh) 一种基于改进YOLOv5的无人机小目标检测方法
CN102385592A (zh) 图像概念的检测方法和装置
CN111783688A (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN115063831A (zh) 一种高性能行人检索与重识别方法及装置
Li et al. Small Object Detection Algorithm Based on Feature Pyramid‐Enhanced Fusion SSD
Wan et al. Lightweight channel attention and multiscale feature fusion discrimination for remote sensing scene classification
CN114882295A (zh) 一种融合隐含知识推理的输电线路多金具识别方法及系统
CN114494777A (zh) 一种基于3D CutMix-Transformer的高光谱图像分类方法及系统
CN117893868A (zh) 一种基于特征增强和多尺度的无参考框图像目标检测方法
CN114049546A (zh) 考虑目标间关系的遥感影像目标检测系统及方法
CN114140524B (zh) 一种多尺度特征融合的闭环检测系统及方法
CN119169638B (zh) 一种基于图文双模态匹配的分布外数据检测系统和方法
CN119131595A (zh) 基于多尺度卷积稀疏编码的高光谱图像变化检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant