CN117236201B - 一种基于Diffusion和ViT的降尺度方法 - Google Patents
一种基于Diffusion和ViT的降尺度方法 Download PDFInfo
- Publication number
- CN117236201B CN117236201B CN202311525721.XA CN202311525721A CN117236201B CN 117236201 B CN117236201 B CN 117236201B CN 202311525721 A CN202311525721 A CN 202311525721A CN 117236201 B CN117236201 B CN 117236201B
- Authority
- CN
- China
- Prior art keywords
- model
- diffusion
- resolution
- precipitation
- steps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000009792 diffusion process Methods 0.000 title claims abstract description 26
- 238000001556 precipitation Methods 0.000 claims abstract description 43
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Image Processing (AREA)
Abstract
本发明公开了一种基于Diffusion和ViT的降尺度方法,包括以下步骤:S1建立低分辨率数值模式降水预报与高分辨率降水观测样本,并进行预处理;S2构建Diffusion‑Vision‑Transformer降水预报模型;S3训练模型,直至Diffusion‑Vision‑Transformer的误差收敛,保存模型并进行预测;本发明通过利用Vision Transformer模型代替原始Diffusion模型中的U‑Net结构,大幅提高模型的训练效率,减低模型用于预测的时间。
Description
技术领域
本发明涉及气象预报技术领域,具体涉及一种基于Diffusion和ViT的降尺度方法。
背景技术
传统统计降尺度方法多数是基于线性框架的模型,难以处理复杂且高维的气象场数据和表征大气非线性动力过程。深度学习的兴起为表征学习如气象要素场之类的、高维且强非线性的复杂数据提供了新的方向。通过利用高效的空间特征提取模块,提取高维空间数据的关键信息,建立低分辨率输入到高分辨率输出的统计模型,深度学习模型能够有效地应用于图片去噪、提高图片分辨率等场景,而此类方法一般被称为“超分辨率”模型。但如何将其高效地迁移到气象学的降尺度问题,同时进一步提高模型的计算效率与预报准确率,仍需要进一步的研究与探索。
发明内容
发明目的:本发明的目的是提供一种基于Diffusion和ViT的降尺度方法以解决数值模式降水预报空间分辨率不足、预报误差大的问题。
技术方案:本发明所述的一种基于Diffusion和ViT的降尺度方法,包括以下步骤:
S1:建立低分辨率数值模式降水预报与高分辨率降水观测样本,并进行预处理;
S2:构建Diffusion-Vision-Transformer降水预报模型;包括以下步骤:
S21:在Diffusion模型中对高分辨率降水观测样本进行前向加噪;
S22:利用Vision-Transformer模型提取低分辨率数值模式降水预报的高阶空间特征;
S23:在Diffusion模型中对步骤S21得到的结果进行去噪,并引入步骤S22得到的高阶空间特征作为条件信息,得到降尺度后的高分辨率降水预报;
S3:训练模型,直至Diffusion-Vision-Transformer的误差收敛,保存模型并进行预测。
进一步的,所述步骤S1中,预处理包括:对数据集进行对数化、归一化的操作。
进一步的,所述步骤S21具体过程如下:
设某一时刻预处理后的高分辨率降水观测样本,分T次逐步对原始观测添加高斯噪声/>,得到/>;则第t时刻的数据分布/>前一时刻/>公式如下:
;
其中,是预设的常数超参数,范围在0和1之间;
最后第t时刻的数据分布可以由第0时刻的数据/>分布得到,公式如下:
;
其中,,且对于/>,则/>。
进一步的,所述S22具体如下:输入配对的高分辨率降水观测样本和低分辨率数值模式降水预报/>,并确定前向加噪的步数T,以及所加随机高斯噪声的方差超参数。
进一步的,所述步骤S23包括以下步骤:
S231:将低分辨率数值模式降水预报分割为若干个图块,然后对分割的图块进行进行线性映射;
S232:利用位置编码表示不同图块的位置信息,将处理后的编码信息作为N组自注意力模块的输入;
S233:利用空间自注意力模块代替卷积操作。
进一步的,所述步骤S231公式如下:
;
其中,为一组分割后的图块,/>为待训练的权重系数,/>为待训练的截断系数,/>为经过线性映射后的一组向量。
进一步的,所述步骤S232位置编码为二维位置嵌入方法。
进一步的,所述步骤S233具体如下:
设一组分割后的图块为,利用三组权重,即查询权重/>、键值权重/>、和数值权重/>,将原始数据分为三个特征:查询矩阵/>、键值矩阵、数值矩阵/>;则/>对应的自注意力/>公式如下:
;
其中,为/>维度的平方根。
进一步的,所述步骤S3具体如下:
设经过步骤S21-S22得到的结果为:,其中,/>为为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为配对的高分辨率降水观测样本,为步骤S21中预设的超参数,T为步骤S21中前向加噪的步数;则步骤S3中Diffusion-Vision-Transforme模型的预报误差/>公式如下:
;
其中,为随机高斯分布,则/>;
当Diffusion-Vision-Transforme模型的预报误差收敛时,逆向推断T步直到得到模型预测/>;其中,前一步的/>由后一步的/>得到,公式如下:
;
其中,为为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为步骤S21中预设的超参数,/>为随机高斯分布,则/>。
本发明所述的一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现任一项所述的一种基于Diffusion和ViT的降尺度方法中的步骤。
有益效果:与现有技术相比,本发明具有如下显著优点:(1)通过利用Diffusion模型提高降尺度预报的精细化程度,尤其在针对降尺度倍数超过4的任务中更具优势;(2)通过利用Vision Transformer模型代替原始Diffusion模型中的U-Net结构,大幅提高模型的训练效率,减低模型用于预测的时间。
附图说明
图1为本发明总流程图;
图2为Diffusion-ViT模型训练流程示意图;
图3为Diffusion模型示意图;
图4为Vision-Transformer模型示意图。
实施方式
下面结合附图对本发明的技术方案作进一步说明。
如图1所示,本发明实施例提供了一种基于Diffusion和ViT的降尺度方法,包括以下步骤:
S1:建立低分辨率数值模式降水预报与高分辨率降水观测样本,并进行预处理;预处理包括:对数据集进行对数化、归一化的操作。
如图2所示,S2:构建Diffusion-Vision-Transformer降水预报模型;包括以下步骤:
S21:在Diffusion模型中对高分辨率降水观测样本进行前向加噪;具体如下:如图3所示,设某一时刻预处理后的高分辨率降水观测样本,分T次逐步对原始观测添加高斯噪声/>,得到/>;则第t时刻的数据分布/>前一时刻/>公式如下:;则第t时刻的数据分布/>前一时刻/>公式如下:
;
其中,是预设的常数超参数,范围在0和1之间;
最后第t时刻的数据分布可以由第0时刻的数据/>分布得到,公式如下:
;
其中,,且对于/>,则/>。
S22:利用Vision-Transformer模型提取低分辨率数值模式降水预报的高阶空间特征;具体如下:输入配对的高分辨率降水观测样本和低分辨率数值模式降水预报/>,并确定前向加噪的步数T,以及所加随机高斯噪声的方差超参数/>。
在Diffusion模型中对步骤S21得到的结果进行去噪,并引入步骤S22得到的高阶空间特征作为条件信息,得到降尺度后的高分辨率降水预报;
包括以下步骤:
S231:如图4所示,将低分辨率数值模式降水预报分割为若干个图块,然后对分割的图块进行进行线性映射;公式如下:
;
其中,为一组分割后的图块,/>为待训练的权重系数,/>为待训练的截断系数,/>为经过线性映射后的一组向量。
S232:利用位置编码表示不同图块的位置信息,将处理后的编码信息作为N组自注意力模块的输入;其中,位置编码为二维位置嵌入方法,具体为:通过对每个图块相对于X轴和Y轴的位置进行编码,用不同的位置编码表示不同图块。
S233:利用空间自注意力模块代替卷积操作。具体如下:
设一组分割后的图块为,利用三组权重,即查询权重/>、键值权重/>、和数值权重/>,将原始数据分为三个特征:查询矩阵/>、键值矩阵、数值矩阵/>;则/>对应的自注意力/>公式如下:
;
其中,为/>维度的平方根。空间自注意力模块由正则层、多头自注意力、残差结构、前馈神经网络组成。
S3:训练模型,直至Diffusion-Vision-Transformer的误差收敛,保存模型并进行预测。具体如下:
设经过步骤S21-S22得到的结果为:,其中,/>为为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为配对的高分辨率降水观测样本,为步骤S21中预设的超参数,T为步骤S21中前向加噪的步数;则步骤S3中Diffusion-Vision-Transforme模型的预报误差/>公式如下:
;
其中,为随机高斯分布,则/>;
当Diffusion-Vision-Transforme模型的预报误差收敛时,逆向推断T步直到得到模型预测/>;其中,前一步的/>由后一步的/>得到,公式如下:
;
其中,为为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为步骤S21中预设的超参数,/>为随机高斯分布,则/>。
本发明实施例还提供一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现任一项所述的一种基于Diffusion和ViT的降尺度方法中的步骤。
Claims (10)
1.一种基于Diffusion和ViT的降尺度方法,其特征在于,包括以下步骤:
S1:建立低分辨率数值模式降水预报与高分辨率降水观测样本,并进行预处理;
S2:构建Diffusion-Vision-Transformer降水预报模型;包括以下步骤:
S21:在Diffusion模型中对高分辨率降水观测样本进行前向加噪;
S22:利用Vision-Transformer模型提取低分辨率数值模式降水预报的高阶空间特征;
S23:在Diffusion模型中对步骤S21得到的结果进行去噪,并引入步骤S22得到的高阶空间特征作为条件信息,得到降尺度后的高分辨率降水预报;
S3:训练模型,直至Diffusion-Vision-Transformer的误差收敛,保存模型并进行预测。
2.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S1中,预处理包括:对数据集进行对数化、归一化的操作。
3.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S21具体过程如下:
设某一时刻预处理后的高分辨率降水观测样本,分T次逐步对原始观测添加高斯噪声,得到/>;则第t时刻的数据分布/>前一时刻/>公式如下:
;
其中,是预设的常数超参数,范围在0和1之间;
最后第t时刻的数据分布可以由第0时刻的数据/>分布得到,公式如下:
;
其中,,且对于/>,则/>。
4.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述S22具体如下:输入配对的高分辨率降水观测样本和低分辨率数值模式降水预报/>,并确定前向加噪的步数T,以及所加随机高斯噪声的方差超参数/>。
5.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S23包括以下步骤:
S231:将低分辨率数值模式降水预报分割为若干个图块,然后对分割的图块进行进行线性映射;
S232:利用位置编码表示不同图块的位置信息,将处理后的编码信息作为N组自注意力模块的输入;
S233:利用空间自注意力模块代替卷积操作。
6.根据权利要求4所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S231公式如下:
;
其中,为一组分割后的图块,/>为待训练的权重系数,/>为待训练的截断系数,为经过线性映射后的一组向量。
7.根据权利要求4所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S232位置编码为二维位置嵌入方法。
8.根据权利要求4所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S233具体如下:
设一组分割后的图块为,利用三组权重,即查询权重/>、键值权重/>、和数值权重/>,将原始数据分为三个特征:查询矩阵/>、键值矩阵/>、数值矩阵/>;则/>对应的自注意力/>公式如下:
;
其中,为/>维度的平方根。
9.根据权利要求1所述的一种基于Diffusion和ViT的降尺度方法,其特征在于,所述步骤S3具体如下:
设经过步骤S21-S22得到的结果为:,其中,/>为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为配对的高分辨率降水观测样本,/>为步骤S21中预设的超参数,T为步骤S21中前向加噪的步数;则步骤S3中Diffusion-Vision-Transformer模型的预报误差/>公式如下:
;
其中,为随机高斯分布,则/>;
当Diffusion-Vision-Transformer模型的预报误差收敛时,逆向推断T步直到得到模型预测/>;其中,前一步的/>由后一步的/>得到,公式如下:
;
其中,为步骤S21-S22得到的模型,/>为低分辨率数值模式降水预报,/>为步骤S21中预设的超参数,/>为随机高斯分布,则/>。
10.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-9任一项所述的一种基于Diffusion和ViT的降尺度方法中的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202311525721.XA CN117236201B (zh) | 2023-11-16 | 2023-11-16 | 一种基于Diffusion和ViT的降尺度方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202311525721.XA CN117236201B (zh) | 2023-11-16 | 2023-11-16 | 一种基于Diffusion和ViT的降尺度方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN117236201A CN117236201A (zh) | 2023-12-15 |
| CN117236201B true CN117236201B (zh) | 2024-02-23 |
Family
ID=89098904
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202311525721.XA Active CN117236201B (zh) | 2023-11-16 | 2023-11-16 | 一种基于Diffusion和ViT的降尺度方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN117236201B (zh) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118033590B (zh) * | 2024-04-12 | 2024-06-28 | 南京信息工程大学 | 一种基于改进vit神经网络的短临降水预报方法 |
| CN118366046B (zh) * | 2024-06-20 | 2024-08-30 | 南京信息工程大学 | 一种基于深度学习并结合地形的风场降尺度方法 |
| CN119720071B (zh) * | 2024-11-01 | 2025-07-15 | 中国气象局成都高原气象研究所 | 一种降水场空间降尺度方法 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6688180B1 (en) * | 1999-07-05 | 2004-02-10 | Sinvent As | Multi-test assembly for evaluating, detecting and mountoring processes at elevated pressure |
| CN109524061A (zh) * | 2018-10-23 | 2019-03-26 | 中国人民解放军陆军防化学院 | 一种基于传输系数矩阵的放射性核素扩散计算方法 |
| CN115964869A (zh) * | 2022-12-14 | 2023-04-14 | 西北核技术研究所 | 一种高时空分辨率大气污染扩散迁移模拟方法 |
| CN116740223A (zh) * | 2023-04-26 | 2023-09-12 | 先进操作系统创新中心(天津)有限公司 | 基于文本生成图像的方法 |
| CN116953642A (zh) * | 2023-06-29 | 2023-10-27 | 安徽大学 | 基于自适应编码Vision Transformer网络的毫米波雷达手势识别方法 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7879263B2 (en) * | 2006-07-24 | 2011-02-01 | Imec | Method and solution to grow charge-transfer complex salts |
| JP6697394B2 (ja) * | 2014-04-10 | 2020-05-20 | イェール ユニバーシティーYale University | 異常折り畳みタンパク質を検出するための方法および組成物 |
| US20230123322A1 (en) * | 2021-04-16 | 2023-04-20 | Strong Force Vcn Portfolio 2019, Llc | Predictive Model Data Stream Prioritization |
| CA3177620A1 (en) * | 2021-05-06 | 2022-11-06 | Strong Force Iot Portfolio 2016, Llc | Quantum, biological, computer vision, and neural network systems for industrial internet of things |
| EP4337467A4 (en) * | 2021-05-11 | 2025-05-07 | Strong Force VCN Portfolio 2019, LLC | SYSTEMS, METHODS, KITS AND APPARATUSES FOR STORAGE AND QUERY DISTRIBUTED AT THE EDGE IN VALUE CHAIN NETWORKS |
| US20220301097A1 (en) * | 2022-06-03 | 2022-09-22 | Intel Corporation | Methods and apparatus to implement dual-attention vision transformers for interactive image segmentation |
-
2023
- 2023-11-16 CN CN202311525721.XA patent/CN117236201B/zh active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6688180B1 (en) * | 1999-07-05 | 2004-02-10 | Sinvent As | Multi-test assembly for evaluating, detecting and mountoring processes at elevated pressure |
| CN109524061A (zh) * | 2018-10-23 | 2019-03-26 | 中国人民解放军陆军防化学院 | 一种基于传输系数矩阵的放射性核素扩散计算方法 |
| CN115964869A (zh) * | 2022-12-14 | 2023-04-14 | 西北核技术研究所 | 一种高时空分辨率大气污染扩散迁移模拟方法 |
| CN116740223A (zh) * | 2023-04-26 | 2023-09-12 | 先进操作系统创新中心(天津)有限公司 | 基于文本生成图像的方法 |
| CN116953642A (zh) * | 2023-06-29 | 2023-10-27 | 安徽大学 | 基于自适应编码Vision Transformer网络的毫米波雷达手势识别方法 |
Non-Patent Citations (3)
| Title |
|---|
| 基于点扩散函数的条件植被温度指数降尺度转换方法;王鹏新;《农业机械学报》;第48卷(第12期);165-173 * |
| 江淮梅雨锋暴雨的中尺度可预报性研究;杨舒楠;《中国博士学位论文全文数据库 基础科学辑》(第6期);A009-6 * |
| 面向多天气退化图像恢复的自注意力扩散模型;秦菁;《上海交通大学学报》;1-22 * |
Also Published As
| Publication number | Publication date |
|---|---|
| CN117236201A (zh) | 2023-12-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN117236201B (zh) | 一种基于Diffusion和ViT的降尺度方法 | |
| CN101950365B (zh) | 基于ksvd字典学习的多任务超分辨率图像重构方法 | |
| CN102156875A (zh) | 基于多任务ksvd字典学习的图像超分辨率重构方法 | |
| CN112560719B (zh) | 基于多尺度卷积-多核池化的高分辨率影像水体提取方法 | |
| CN114792126A (zh) | 一种基于遗传算法的卷积神经网络设计方法 | |
| CN113537573A (zh) | 基于双重时空特征提取的风电功率运行趋势预测方法 | |
| CN115170874A (zh) | 一种基于解耦蒸馏损失的自蒸馏实现方法 | |
| CN113611354B (zh) | 一种基于轻量级深度卷积网络的蛋白质扭转角预测方法 | |
| CN117060401A (zh) | 新能源功率预测方法、装置、设备和计算机可读存储介质 | |
| CN111639751A (zh) | 一种用于二值卷积神经网络的非零填补训练方法 | |
| CN115019101A (zh) | 图像分类网络中基于信息瓶颈算法的图像分类方法 | |
| CN116698410B (zh) | 一种基于卷积神经网络的滚动轴承多传感器数据监控方法 | |
| CN114120315A (zh) | 一种基于小样本的识别电镜病毒的方法及装置 | |
| US20250139754A1 (en) | Detection method and system of power equipment based on multispectral image | |
| CN114357211B (zh) | 基于自适应分布均衡特征的对比学习哈希图像检索方法 | |
| CN117495153A (zh) | 一种区域电网线损影响因子快速修正方法及系统 | |
| CN118587451A (zh) | 一种掩码增强型的海洋要素场智能空间降尺度方法 | |
| CN117975174A (zh) | 一种基于改进vqgan的三维数字岩心重构方法 | |
| CN117768338A (zh) | 一种基于梯度提升树的网络流量矩阵预测方法 | |
| CN117612641A (zh) | 用于镁阳极材料成分预测的深度学习框架 | |
| CN117523333A (zh) | 一种基于注意力机制的地表覆盖分类方法 | |
| CN116310644A (zh) | 一种基于归一化流网络和编码器的异常检测方法及设备 | |
| CN119129795B (zh) | 一种基于多尺度大核时空预测神经网络的气温时空预测方法 | |
| CN118735082B (zh) | 一种基于3D-TimesNet的次季节气温预报订正方法 | |
| CN118711612B (zh) | 基于多分类半监督支持矩阵机的故障诊断方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |