[go: up one dir, main page]

CN117236201B - 一种基于Diffusion和ViT的降尺度方法 - Google Patents

一种基于Diffusion和ViT的降尺度方法 Download PDF

Info

Publication number
CN117236201B
CN117236201B CN202311525721.XA CN202311525721A CN117236201B CN 117236201 B CN117236201 B CN 117236201B CN 202311525721 A CN202311525721 A CN 202311525721A CN 117236201 B CN117236201 B CN 117236201B
Authority
CN
China
Prior art keywords
model
diffusion
resolution
precipitation
steps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311525721.XA
Other languages
English (en)
Other versions
CN117236201A (zh
Inventor
季焱
智协飞
张永宏
卢楚翰
彭婷
张玲
王靖宇
陈超辉
吉璐莹
吕阳
朱寿鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute Of Meteorological Science And Technology Innovation
National University of Defense Technology
Nanjing University of Information Science and Technology
Wuxi University
Original Assignee
Nanjing Institute Of Meteorological Science And Technology Innovation
National University of Defense Technology
Nanjing University of Information Science and Technology
Wuxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute Of Meteorological Science And Technology Innovation, National University of Defense Technology, Nanjing University of Information Science and Technology, Wuxi University filed Critical Nanjing Institute Of Meteorological Science And Technology Innovation
Priority to CN202311525721.XA priority Critical patent/CN117236201B/zh
Publication of CN117236201A publication Critical patent/CN117236201A/zh
Application granted granted Critical
Publication of CN117236201B publication Critical patent/CN117236201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Image Processing (AREA)

Abstract

本发明公开了一种基于Diffusion和ViT的降尺度方法,包括以下步骤:S1建立低分辨率数值模式降水预报与高分辨率降水观测样本,并进行预处理;S2构建Diffusion‑Vision‑Transformer降水预报模型;S3训练模型,直至Diffusion‑Vision‑Transformer的误差收敛,保存模型并进行预测;本发明通过利用Vision Transformer模型代替原始Diffusion模型中的U‑Net结构,大幅提高模型的训练效率,减低模型用于预测的时间。

Description

一种基于Diffusion和ViT的降尺度方法
技术领域
本发明涉及气象预报技术领域,具体涉及一种基于Diffusion和ViT的降尺度方法。
背景技术
传统统计降尺度方法多数是基于线性框架的模型,难以处理复杂且高维的气象场数据和表征大气非线性动力过程。深度学习的兴起为表征学习如气象要素场之类的、高维且强非线性的复杂数据提供了新的方向。通过利用高效的空间特征提取模块,提取高维空间数据的关键信息,建立低分辨率输入到高分辨率输出的统计模型,深度学习模型能够有效地应用于图片去噪、提高图片分辨率等场景,而此类方法一般被称为“超分辨率”模型。但如何将其高效地迁移到气象学的降尺度问题,同时进一步提高模型的计算效率与预报准确率,仍需要进一步的研究与探索。
发明内容
发明目的:本发明的目的是提供一种基于Diffusion和ViT的降尺度方法以解决数值模式降水预报空间分辨率不足、预报误差大的问题。
技术方案:本发明所述的一种基于Diffusion和ViT的降尺度方法,包括以下步骤:
S1:建立低分辨率数值模式降水预报与高分辨率降水观测样本,并进行预处理;
S2:构建Diffusion-Vision-Transformer降水预报模型;包括以下步骤:
S21:在Diffusion模型中对高分辨率降水观测样本进行前向加噪;
S22:利用Vision-Transformer模型提取低分辨率数值模式降水预报的高阶空间特征;
S23:在Diffusion模型中对步骤S21得到的结果进行去噪,并引入步骤S22得到的高阶空间特征作为条件信息,得到降尺度后的高分辨率降水预报;
S3:训练模型,直至Diffusion-Vision-Transformer的误差收敛,保存模型并进行预测。
进一步的,所述步骤S1中,预处理包括:对数据集进行对数化、归一化的操作。
进一步的,所述步骤S21具体过程如下:
设某一时刻预处理后的高分辨率降水观测样本,分T次逐步对原始观测添加高斯噪声/>,得到/>;则第t时刻的数据分布/>前一时刻/>公式如下:
其中,是预设的常数超参数,范围在0和1之间;
最后第t时刻的数据分布可以由第0时刻的数据/>分布得到,公式如下:
其中,,且对于/>,则/>
进一步的,所述S22具体如下:输入配对的高分辨率降水观测样本和低分辨率数值模式降水预报/>,并确定前向加噪的步数T,以及所加随机高斯噪声的方差超参数
进一步的,所述步骤S23包括以下步骤:
S231:将低分辨率数值模式降水预报分割为若干个图块,然后对分割的图块进行进行线性映射;
S232:利用位置编码表示不同图块的位置信息,将处理后的编码信息作为N组自注意力模块的输入;
S233:利用空间自注意力模块代替卷积操作。
进一步的,所述步骤S231公式如下:
;
其中,为一组分割后的图块,/>为待训练的权重系数,/>为待训练的截断系数,/>为经过线性映射后的一组向量。
进一步的,所述步骤S232位置编码为二维位置嵌入方法。
进一步的,所述步骤S233具体如下:
设一组分割后的图块为,利用三组权重,即查询权重/>、键值权重/>、和数值权重/>,将原始数据分为三个特征:查询矩阵/>、键值矩阵、数值矩阵/>;则/>对应的自注意力/>公式如下:
其中,为/>维度的平方根。
进一步的,所述步骤S3具体如下:
设经过步骤S21-S22得到的结果为:,其中,/>为为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为配对的高分辨率降水观测样本,为步骤S21中预设的超参数,T为步骤S21中前向加噪的步数;则步骤S3中Diffusion-Vision-Transforme模型的预报误差/>公式如下:
其中,为随机高斯分布,则/>
当Diffusion-Vision-Transforme模型的预报误差收敛时,逆向推断T步直到得到模型预测/>;其中,前一步的/>由后一步的/>得到,公式如下:
其中,为为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为步骤S21中预设的超参数,/>为随机高斯分布,则/>
本发明所述的一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现任一项所述的一种基于Diffusion和ViT的降尺度方法中的步骤。
有益效果:与现有技术相比,本发明具有如下显著优点:(1)通过利用Diffusion模型提高降尺度预报的精细化程度,尤其在针对降尺度倍数超过4的任务中更具优势;(2)通过利用Vision Transformer模型代替原始Diffusion模型中的U-Net结构,大幅提高模型的训练效率,减低模型用于预测的时间。
附图说明
图1为本发明总流程图;
图2为Diffusion-ViT模型训练流程示意图;
图3为Diffusion模型示意图;
图4为Vision-Transformer模型示意图。
实施方式
下面结合附图对本发明的技术方案作进一步说明。
如图1所示,本发明实施例提供了一种基于Diffusion和ViT的降尺度方法,包括以下步骤:
S1:建立低分辨率数值模式降水预报与高分辨率降水观测样本,并进行预处理;预处理包括:对数据集进行对数化、归一化的操作。
如图2所示,S2:构建Diffusion-Vision-Transformer降水预报模型;包括以下步骤:
S21:在Diffusion模型中对高分辨率降水观测样本进行前向加噪;具体如下:如图3所示,设某一时刻预处理后的高分辨率降水观测样本,分T次逐步对原始观测添加高斯噪声/>,得到/>;则第t时刻的数据分布/>前一时刻/>公式如下:;则第t时刻的数据分布/>前一时刻/>公式如下:
其中,是预设的常数超参数,范围在0和1之间;
最后第t时刻的数据分布可以由第0时刻的数据/>分布得到,公式如下:
其中,,且对于/>,则/>
S22:利用Vision-Transformer模型提取低分辨率数值模式降水预报的高阶空间特征;具体如下:输入配对的高分辨率降水观测样本和低分辨率数值模式降水预报/>,并确定前向加噪的步数T,以及所加随机高斯噪声的方差超参数/>
在Diffusion模型中对步骤S21得到的结果进行去噪,并引入步骤S22得到的高阶空间特征作为条件信息,得到降尺度后的高分辨率降水预报;
包括以下步骤:
S231:如图4所示,将低分辨率数值模式降水预报分割为若干个图块,然后对分割的图块进行进行线性映射;公式如下:
;
其中,为一组分割后的图块,/>为待训练的权重系数,/>为待训练的截断系数,/>为经过线性映射后的一组向量。
S232:利用位置编码表示不同图块的位置信息,将处理后的编码信息作为N组自注意力模块的输入;其中,位置编码为二维位置嵌入方法,具体为:通过对每个图块相对于X轴和Y轴的位置进行编码,用不同的位置编码表示不同图块。
S233:利用空间自注意力模块代替卷积操作。具体如下:
设一组分割后的图块为,利用三组权重,即查询权重/>、键值权重/>、和数值权重/>,将原始数据分为三个特征:查询矩阵/>、键值矩阵、数值矩阵/>;则/>对应的自注意力/>公式如下:
其中,为/>维度的平方根。空间自注意力模块由正则层、多头自注意力、残差结构、前馈神经网络组成。
S3:训练模型,直至Diffusion-Vision-Transformer的误差收敛,保存模型并进行预测。具体如下:
设经过步骤S21-S22得到的结果为:,其中,/>为为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为配对的高分辨率降水观测样本,为步骤S21中预设的超参数,T为步骤S21中前向加噪的步数;则步骤S3中Diffusion-Vision-Transforme模型的预报误差/>公式如下:
其中,为随机高斯分布,则/>
当Diffusion-Vision-Transforme模型的预报误差收敛时,逆向推断T步直到得到模型预测/>;其中,前一步的/>由后一步的/>得到,公式如下:
其中,为为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为步骤S21中预设的超参数,/>为随机高斯分布,则/>
本发明实施例还提供一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现任一项所述的一种基于Diffusion和ViT的降尺度方法中的步骤。

Claims (10)

1.一种基于Diffusion和ViT的降尺度方法,其特征在于,包括以下步骤:
S1:建立低分辨率数值模式降水预报与高分辨率降水观测样本,并进行预处理;
S2:构建Diffusion-Vision-Transformer降水预报模型;包括以下步骤:
S21:在Diffusion模型中对高分辨率降水观测样本进行前向加噪;
S22:利用Vision-Transformer模型提取低分辨率数值模式降水预报的高阶空间特征;
S23:在Diffusion模型中对步骤S21得到的结果进行去噪,并引入步骤S22得到的高阶空间特征作为条件信息,得到降尺度后的高分辨率降水预报;
S3:训练模型,直至Diffusion-Vision-Transformer的误差收敛,保存模型并进行预测。
2.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S1中,预处理包括:对数据集进行对数化、归一化的操作。
3.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S21具体过程如下:
设某一时刻预处理后的高分辨率降水观测样本,分T次逐步对原始观测添加高斯噪声,得到/>;则第t时刻的数据分布/>前一时刻/>公式如下:
其中,是预设的常数超参数,范围在0和1之间;
最后第t时刻的数据分布可以由第0时刻的数据/>分布得到,公式如下:
其中,,且对于/>,则/>
4.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述S22具体如下:输入配对的高分辨率降水观测样本和低分辨率数值模式降水预报/>,并确定前向加噪的步数T,以及所加随机高斯噪声的方差超参数/>
5.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S23包括以下步骤:
S231:将低分辨率数值模式降水预报分割为若干个图块,然后对分割的图块进行进行线性映射;
S232:利用位置编码表示不同图块的位置信息,将处理后的编码信息作为N组自注意力模块的输入;
S233:利用空间自注意力模块代替卷积操作。
6.根据权利要求4所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S231公式如下:
;
其中,为一组分割后的图块,/>为待训练的权重系数,/>为待训练的截断系数,为经过线性映射后的一组向量。
7.根据权利要求4所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S232位置编码为二维位置嵌入方法。
8.根据权利要求4所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S233具体如下:
设一组分割后的图块为,利用三组权重,即查询权重/>、键值权重/>、和数值权重/>,将原始数据分为三个特征:查询矩阵/>、键值矩阵/>、数值矩阵/>;则/>对应的自注意力/>公式如下:
其中,为/>维度的平方根。
9.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S3具体如下:
设经过步骤S21-S22得到的结果为:,其中,/>为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为配对的高分辨率降水观测样本,/>为步骤S21中预设的超参数,T为步骤S21中前向加噪的步数;则步骤S3中Diffusion-Vision-Transformer模型的预报误差/>公式如下:
其中,为随机高斯分布,则/>
当Diffusion-Vision-Transformer模型的预报误差收敛时,逆向推断T步直到得到模型预测/>;其中,前一步的/>由后一步的/>得到,公式如下:
其中,为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为步骤S21中预设的超参数,/>为随机高斯分布,则/>
10.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-9任一项所述的一种基于Diffusion和ViT的降尺度方法中的步骤。
CN202311525721.XA 2023-11-16 2023-11-16 一种基于Diffusion和ViT的降尺度方法 Active CN117236201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311525721.XA CN117236201B (zh) 2023-11-16 2023-11-16 一种基于Diffusion和ViT的降尺度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311525721.XA CN117236201B (zh) 2023-11-16 2023-11-16 一种基于Diffusion和ViT的降尺度方法

Publications (2)

Publication Number Publication Date
CN117236201A CN117236201A (zh) 2023-12-15
CN117236201B true CN117236201B (zh) 2024-02-23

Family

ID=89098904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311525721.XA Active CN117236201B (zh) 2023-11-16 2023-11-16 一种基于Diffusion和ViT的降尺度方法

Country Status (1)

Country Link
CN (1) CN117236201B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118033590B (zh) * 2024-04-12 2024-06-28 南京信息工程大学 一种基于改进vit神经网络的短临降水预报方法
CN118366046B (zh) * 2024-06-20 2024-08-30 南京信息工程大学 一种基于深度学习并结合地形的风场降尺度方法
CN119720071B (zh) * 2024-11-01 2025-07-15 中国气象局成都高原气象研究所 一种降水场空间降尺度方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6688180B1 (en) * 1999-07-05 2004-02-10 Sinvent As Multi-test assembly for evaluating, detecting and mountoring processes at elevated pressure
CN109524061A (zh) * 2018-10-23 2019-03-26 中国人民解放军陆军防化学院 一种基于传输系数矩阵的放射性核素扩散计算方法
CN115964869A (zh) * 2022-12-14 2023-04-14 西北核技术研究所 一种高时空分辨率大气污染扩散迁移模拟方法
CN116740223A (zh) * 2023-04-26 2023-09-12 先进操作系统创新中心(天津)有限公司 基于文本生成图像的方法
CN116953642A (zh) * 2023-06-29 2023-10-27 安徽大学 基于自适应编码Vision Transformer网络的毫米波雷达手势识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7879263B2 (en) * 2006-07-24 2011-02-01 Imec Method and solution to grow charge-transfer complex salts
JP6697394B2 (ja) * 2014-04-10 2020-05-20 イェール ユニバーシティーYale University 異常折り畳みタンパク質を検出するための方法および組成物
US20230123322A1 (en) * 2021-04-16 2023-04-20 Strong Force Vcn Portfolio 2019, Llc Predictive Model Data Stream Prioritization
CA3177620A1 (en) * 2021-05-06 2022-11-06 Strong Force Iot Portfolio 2016, Llc Quantum, biological, computer vision, and neural network systems for industrial internet of things
EP4337467A4 (en) * 2021-05-11 2025-05-07 Strong Force VCN Portfolio 2019, LLC SYSTEMS, METHODS, KITS AND APPARATUSES FOR STORAGE AND QUERY DISTRIBUTED AT THE EDGE IN VALUE CHAIN NETWORKS
US20220301097A1 (en) * 2022-06-03 2022-09-22 Intel Corporation Methods and apparatus to implement dual-attention vision transformers for interactive image segmentation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6688180B1 (en) * 1999-07-05 2004-02-10 Sinvent As Multi-test assembly for evaluating, detecting and mountoring processes at elevated pressure
CN109524061A (zh) * 2018-10-23 2019-03-26 中国人民解放军陆军防化学院 一种基于传输系数矩阵的放射性核素扩散计算方法
CN115964869A (zh) * 2022-12-14 2023-04-14 西北核技术研究所 一种高时空分辨率大气污染扩散迁移模拟方法
CN116740223A (zh) * 2023-04-26 2023-09-12 先进操作系统创新中心(天津)有限公司 基于文本生成图像的方法
CN116953642A (zh) * 2023-06-29 2023-10-27 安徽大学 基于自适应编码Vision Transformer网络的毫米波雷达手势识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于点扩散函数的条件植被温度指数降尺度转换方法;王鹏新;《农业机械学报》;第48卷(第12期);165-173 *
江淮梅雨锋暴雨的中尺度可预报性研究;杨舒楠;《中国博士学位论文全文数据库 基础科学辑》(第6期);A009-6 *
面向多天气退化图像恢复的自注意力扩散模型;秦菁;《上海交通大学学报》;1-22 *

Also Published As

Publication number Publication date
CN117236201A (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
CN117236201B (zh) 一种基于Diffusion和ViT的降尺度方法
CN101950365B (zh) 基于ksvd字典学习的多任务超分辨率图像重构方法
CN102156875A (zh) 基于多任务ksvd字典学习的图像超分辨率重构方法
CN112560719B (zh) 基于多尺度卷积-多核池化的高分辨率影像水体提取方法
CN114792126A (zh) 一种基于遗传算法的卷积神经网络设计方法
CN113537573A (zh) 基于双重时空特征提取的风电功率运行趋势预测方法
CN115170874A (zh) 一种基于解耦蒸馏损失的自蒸馏实现方法
CN113611354B (zh) 一种基于轻量级深度卷积网络的蛋白质扭转角预测方法
CN117060401A (zh) 新能源功率预测方法、装置、设备和计算机可读存储介质
CN111639751A (zh) 一种用于二值卷积神经网络的非零填补训练方法
CN115019101A (zh) 图像分类网络中基于信息瓶颈算法的图像分类方法
CN116698410B (zh) 一种基于卷积神经网络的滚动轴承多传感器数据监控方法
CN114120315A (zh) 一种基于小样本的识别电镜病毒的方法及装置
US20250139754A1 (en) Detection method and system of power equipment based on multispectral image
CN114357211B (zh) 基于自适应分布均衡特征的对比学习哈希图像检索方法
CN117495153A (zh) 一种区域电网线损影响因子快速修正方法及系统
CN118587451A (zh) 一种掩码增强型的海洋要素场智能空间降尺度方法
CN117975174A (zh) 一种基于改进vqgan的三维数字岩心重构方法
CN117768338A (zh) 一种基于梯度提升树的网络流量矩阵预测方法
CN117612641A (zh) 用于镁阳极材料成分预测的深度学习框架
CN117523333A (zh) 一种基于注意力机制的地表覆盖分类方法
CN116310644A (zh) 一种基于归一化流网络和编码器的异常检测方法及设备
CN119129795B (zh) 一种基于多尺度大核时空预测神经网络的气温时空预测方法
CN118735082B (zh) 一种基于3D-TimesNet的次季节气温预报订正方法
CN118711612B (zh) 基于多分类半监督支持矩阵机的故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant