CN110673637B - 一种基于深度强化学习的无人机伪路径规划的方法 - Google Patents
一种基于深度强化学习的无人机伪路径规划的方法 Download PDFInfo
- Publication number
- CN110673637B CN110673637B CN201910948346.7A CN201910948346A CN110673637B CN 110673637 B CN110673637 B CN 110673637B CN 201910948346 A CN201910948346 A CN 201910948346A CN 110673637 B CN110673637 B CN 110673637B
- Authority
- CN
- China
- Prior art keywords
- flight
- uav
- reinforcement learning
- deep reinforcement
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于深度强化学习的无人机伪路径规划的方法,首先在飞行地图上划分禁飞区域的边界坐标和标记出无人机飞行任务的起点坐标和终点坐标位置;执行飞行任务前感知无人机当前环境状态,利用深度强化学习算法,根据得到的Q函数值选择当前环境下的偏转角度和飞行动作;无人机根据在飞行过程中不断地接收来自地面基站发射设备给出飞行的位置数据并与环境进行交互得到的奖励回报更新Q函数;飞行过程中将禁飞区域作为虚拟障碍物,判断无人机是否按照预设航线飞行;若接近禁飞区域边缘,则通过奖励函数引导无人机规划伪航行路径,避开禁飞区域;本发明实现了对未知环境下的无人机的伪路径规划,提高无人机飞行的智能化,安全化。
Description
技术领域
本发明属于机器学习技术领域,尤其涉及一种基于深度强化学习的无人机伪路径规划的方法。
背景技术
随着计算水平和人工智能领域的长足进步,无人机应用的领域越来越多,尤其在军事航空领域的应用也越来越广泛,无人机执行任务的种类也越来越复杂,在军事侦察领域和航空运输领域发挥了重要的作用。无人机航迹规划智能化的要求也越来越高,在无人机执行特殊任务时,按照规定要求从起点到终点的飞行过程中,无人机还要避开正常的民航飞行区域和雷达监测区域,以免对民航飞机的飞行和雷达监测造成干扰。为了更好的服务于各个领域的应用,无人机伪路径规划的研究成为当前无人机航迹规划的研究热点和难点。
随着人工智能技术的进步,近年来基于深度神经网络和深度强化学习的智能体控制方法进入大众视野。强化学习是机器学习的重要分支之一,它通过环境建模,对智能体的每一个动作进行反馈,通过设置积累奖励的目标函数,最大化一个智能体在当前状态所能取得的未来期望收获,来辅助智能体在每一个状态采取更明智的行为和动作。深度强化学习是一种利用神经网络优化智能体策略的算法,它通过神经网络存储参数的功能,消除了传统学习方法诸如:时序差分,现实策略差分算法中的维数灾难问题,为实时计算提供了思路。
在解决实际求解无人机航迹路径规划的过程中,根据不同的任务,地形环境的复杂程度的不同,选择符合航迹规划的智能算法,现有的算法在进行航迹规划时按照无人机实时的飞行路径和避障进行规划航行,但在实际情况中,空域中一些禁飞区域为不可检测的隐形障碍物,在无人机飞行的过程中很容易误入禁区飞行,造成其他空域的飞行危险。
发明内容
本发明的目的在于克服现有无人机航迹规划的一般思维,提供一种基于深度强化学习的无人机伪路径规划的方法。本发明针对无人机避开禁区飞行规划出伪航迹,在无人机实际规划的航线和飞行禁区相冲突时,利用伪航迹引导无人机避开飞行禁区,保证空域内无人机的飞行安全和其他区域的正常运行。
本发明所采用的技术方案是:一种基于深度强化学习的无人机伪路径规划的方法,其特征在于,包括以下步骤:
步骤1:在飞行地图上划分禁飞区域的边界坐标,并标记出无人机飞行的起点和终点位置坐标;
步骤2:执行飞行任务前感知无人机当前环境状态,包括低、高空气候数据,无人机飞行高度,无人机飞行位置坐标;基于当前环境状态信息,利用深度强化学习算法,根据得到的Q函数值选择当前环境下的飞行偏转角度和动作;无人机根据在飞行过程中不断地接收来自地面基站发射设备给出飞行的位置数据并与环境进行交互得到的奖励回报更新Q函数;
步骤3:飞行过程中将禁飞区域作为虚拟障碍物,判断无人机是否按照正常的航线飞行;
若远离禁飞区,无人机继续与环境交互规划路径,执行步骤2;
若接近禁飞区域边缘,则通过深度强化学习的奖励函数引导无人机规划伪航行路线,避开禁飞区域;
步骤4:若无人机到达终点,则结束飞行;否则继续执行步骤2。
本发明的优点在于:
1.本发明能够在复杂的环境下实现无人机的路径规划,从而使得无人机能够高效地飞行到目标位置,完成后续的任务。
2.本发明能够利用深度强化学习方法为无人机规划出一条躲避禁飞空域的飞行伪路径,保证了无人机在没有实体障碍物的情况下不误飞入航空禁区和雷达监测区,避免干扰其他空域的正常工作,具有高效性和安全性,智能性。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例中深度强化学习Double DQN算法的原理框图;
图3为本发明实施例中利用深度强化学习DoubleDQN算法的无人机伪路径规划示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明采用一种基于深度强化学习的无人机伪路径规划的方法来避免无人机在航空飞行时误入航空飞行禁区的危险,利用深度强化学习算法结合栅格地图定位,将禁飞空域作为虚拟障碍物,在无人机规划的航迹误入禁区时,通过强化学习算法将为无人机重新规划一条伪路径,使其避开航空禁区,保证无人机的飞行安全和其他航空区域的正常运行,同时提高了无人机的航路规划的效率和安全性能。
请见图1,本发明提供的一种基于深度强化学习的无人机伪路径规划的方法,包括以下步骤:
步骤1:在飞行地图上划分禁飞区域的边界坐标,并标记出无人机飞行的起点和终点位置坐标;
本实施例中的禁飞区域,包括正常民航飞行航空区域以及雷达区;
本实施例中,首先将飞行地图模拟为栅格环境模型,栅格环境模型将无人机的飞行环境划分为一系列具有二值信息的大小相同或不同的单元格,其中一些单元格划分为禁飞区域;禁飞区域的边界坐标在栅格环境模型上明确标出为{(xi,yi),(xi+1,yi+1),(xi+2,yi+2)……(xi+m,yi+n)|m,n>0,i≥1};在飞行地图上同时标出无人机飞行的起点(Xstart,Ystart)和终点(Xend,Yend)的位置坐标。
步骤2:执行飞行任务前感知无人机当前环境状态,包括低、高空气候数据,无人机飞行高度,无人机飞行位置坐标;基于当前环境状态信息,利用深度强化学习算法,根据得到的Q函数值选择当前环境下的飞行偏转角度和动作;无人机根据在飞行过程中不断地接收来自地面基站发射设备给出飞行的位置数据并与环境进行交互得到的奖励回报更新0函数;
本实施例中,深度强化学习网络为Double DQN,为双DQN神经网络网络的深度强化学习网络;
Double DQN是利用深度学习中的卷积神经网络和强化学习的Q-learning算法相结合的改进型深度卷积神经网络;
深度强化学习网络包括无人机飞行时的状态集{S1,S2,S3……St,t≥1},动作集{a1,a2,a3……at,t≥1},奖励函数R(s),以及深度强化学习网络权重值θ;
深度强化学习根据状态集、动作集、奖励函数代入到状态行为值函数Qt(st,at)中;Qt(st,at)的函数为:
其中Qt+1(st,at)为t+1时刻对应的Q值,Qt(st,at)为t时刻的Q值,α∈(0.5,1]为学习速率,γ∈(0,1)为折扣因子,Rt为执行t时刻动作时的回报值;max为求Qt+1(st+1,at)或者Qt(st,at)值最大对应的Q值;如果状态s经过动作a后到达目标点栅格,那么R(s,a)=1;如果状态s经过动作a后到达障碍物栅格,那么R(s,a)=-1;其他情况下R(s,a)=0。
目标网络权重θ加入后动作行为值函数更新为:
其中,Vt+1为t+1时刻根据当前的状态行为值函数Qt(st,at;θ)所得到的行为值函数用来更新t+1时刻的状态行为值;深度强化学习Double DQN中将动作的选择和动作的评估分别用不同的值函数实现;
动作选择时的值函数公式为公式:
Yt Q=Rt+1+ymaxaQ(St+1,a;θ);
动作选择时的值函数做出选择时首先选择一个动作a*,该动作a*应该满足在状态St+1处Q(St+1,a)最大;其中Rt+1表示t+1时刻的奖励值;
动作评估时的值函数为在选出最大的动作a*之后选择不同的网络权重θ′动作评估的公式;
本实施例中,深度强化学习网络权重θ的选择为优先回放;请见图2,具体实现包括以下子步骤:
步骤2.1:无人机首先在空中飞行环境中进行训练,由无人机与环境的交互中收集状态动作数据集放入回放记忆单元中;
步骤2.2:深度强化学习的神经网络分为现实网络和估计网络两部分,当回放记忆单元所存储的经验数据超过设定的数据集数量时,智能体(强化学习里面的学习大脑)开始训练;
步骤2.3:无人机在与环境的交互根据当前的状态选择动作,其中现实网络和估计网络的结构一样,只是用于训练的神经网络的参数不同;现实网络根据无人机当前状态在神经网络中进行训练得到最大的状态行为值Q(s,a;θ),同时估计网络经过训练神经网络的训练得到下一状态下的状态行为值maxa′Q(s′,a′;θ′),得到现实网络和估计网络的误差函数,利用随机梯度下降法得到贪婪策略下的最大的状态行为值函数argmaxaQ(s,a;θ);无人机根据状态行为值函数选择下一步的动作,并继续与环境进行交互。
本实施例中,无人机在飞行过程中与环境不断的进行交互,根据Double DQN算法不断的更新状态行为值函数Qt(st,at;θ),更新航路轨迹。
步骤3:飞行过程中将禁飞区域作为虚拟障碍物,判断无人机是否按照正常的航线飞行;
若远离禁飞区,无人机继续与环境交互规划路径,执行步骤2;
若接近禁飞区域边缘,则通过深度强化学习的奖励函数引导无人机规划伪航行路线,避开禁飞区域;
步骤4:若无人机到达终点,则结束飞行;否则继续执行步骤2。
本实施例中,航迹规划的伪路径示意图如图3。
本发明现在利用强化学习和深度学习的神经网络相结合的深度强化学习方法进行无人机伪路径的规划,利用智能体和环境的交互得到策略函数值,指导无人机飞行动作的选择,该深度强化学习的方法收敛性和泛化能力更强,提高了无人机飞行的智能化程度。
应当理解的是,本说明书未详细阐述的部分均属于现有技术;上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (4)
1.一种基于深度强化学习的无人机伪路径规划的方法,其特征在于,包括以下步骤:
步骤1:在飞行地图上划分禁飞区域的边界坐标,并标记出无人机飞行的起点和终点位置坐标;
步骤2:执行飞行任务前感知无人机当前环境状态,包括低、高空气候数据,无人机飞行高度,无人机飞行位置坐标;基于当前环境状态信息,利用深度强化学习算法,根据得到的Q函数值选择当前环境下的飞行偏转角度和动作;无人机根据在飞行过程中不断地接收来自地面基站发射设备给出飞行的位置数据并与环境进行交互得到的奖励回报更新Q函数;
其中,所述深度强化学习算法是利用深度学习中的卷积神经网络和强化学习的Q-learning算法相结合的改进型深度卷积神经网络算法;
所述深度强化学习算法包括无人机飞行时的状态集{S1,S2,S3......St,t≥1},动作集{a1,a2,a3......at,t≥1},奖励函数R(s),以及深度强化学习目标网络权重θ;
所述深度强化学习根据状态集、动作集、奖励函数代入到状态行为值函数Qt(st,at)中;
所述Qt(st,at)的函数为:
其中Qt+1(st,at)为t+1时刻对应的Q值,Qt(st,at)为t时刻的Q值,α为学习速率,γ为折扣因子,Rt为执行t时刻动作时的回报值;
所述目标网络权值θ加入后动作行为值函数更新为:
其中,Vt+1为t+1时刻根据当前的状态行为值函数Qt(st,at;θ)所得到的行为值函数用来更新t+1时刻的状态行为值;深度强化学习Double DQN中将动作的选择和动作的评估分别用不同的值函数实现;
动作选择时的值函数公式为公式:
动作选择时的值函数做出选择时首先选择一个动作a*,该动作a*应该满足在状态St+1处Q(St+1,a)最大;其中Rt+1表示t+1时刻的奖励值;
动作评估时的值函数为在选出最大的动作a*之后选择不同的网络权重θ′动作评估的公式;
步骤3:飞行过程中将禁飞区域作为虚拟障碍物,判断无人机是否按照正常的航线飞行;
若远离禁飞区,无人机继续与环境交互规划路径,执行步骤2;
若接近禁飞区域边缘,则通过深度强化学习算法的奖励函数引导无人机规划伪航行路线,避开禁飞区域;
步骤4:若无人机到达终点,则结束飞行;否则继续执行步骤2。
2.根据权利要求1所述的基于深度强化学习的无人机伪路径规划的方法,其特征在于:步骤1中,首先将飞行地图模拟为栅格环境模型,栅格环境模型将无人机的飞行环境划分为一系列具有二值信息的大小相同或不同的单元格,其中一些单元格划分为禁飞区域;禁飞区域的边界坐标在栅格环境模型上明确标出为{(xi,yi),(xi+1,yi+1),(xi+2,yi+2)......(xi+m,yi+n)|m,n>0,i≥1};在飞行地图上同时标出无人机飞行的起点(Xstart,Ystart)和终点(Xend,Yend)的位置坐标。
3.根据权利要求1所述的基于深度强化学习的无人机伪路径规划的方法,其特征在于:步骤2中,所述深度强化学习算法权重值θ的选择为优先回放;具体实现包括以下子步骤:
步骤2.1:无人机首先在空中飞行环境中进行训练,由无人机与环境的交互中收集状态动作数据集放入回放记忆单元中;
步骤2.2:深度强化学习的神经网络分为现实网络和估计网络两部分,当回放记忆单元所存储的经验数据超过设定的数据集数量时,智能体开始训练;
步骤2.3:无人机在与环境的交互根据当前的状态选择动作,其中现实网络和估计网络的结构一样,只是用于训练的神经网络的参数不同;现实网络根据无人机当前状态在神经网络中进行训练得到最大的状态行为值Q(s,a;θ),同时估计网络经过训练神经网络的训练得到下一状态下的状态行为值maxa'Q(s',a';θ'),得到现实网络和估计网络的误差函数,利用随机梯度下降法得到贪婪策略下的最大的状态行为值函数arg maxaQ(s,a;θ);无人机根据状态行为值函数选择下一步的动作,并继续与环境进行交互。
4.根据权利要求3所述的基于深度强化学习的无人机伪路径规划的方法,其特征在于:步骤2中,无人机在飞行过程中与环境不断的进行交互,根据深度强化学习算法不断的更新状态行为值函数Q(s,a;θ),更新航路轨迹。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910948346.7A CN110673637B (zh) | 2019-10-08 | 2019-10-08 | 一种基于深度强化学习的无人机伪路径规划的方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910948346.7A CN110673637B (zh) | 2019-10-08 | 2019-10-08 | 一种基于深度强化学习的无人机伪路径规划的方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN110673637A CN110673637A (zh) | 2020-01-10 |
| CN110673637B true CN110673637B (zh) | 2022-05-13 |
Family
ID=69080721
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201910948346.7A Active CN110673637B (zh) | 2019-10-08 | 2019-10-08 | 一种基于深度强化学习的无人机伪路径规划的方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN110673637B (zh) |
Families Citing this family (42)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112783192B (zh) * | 2019-11-11 | 2022-11-22 | 中国移动通信集团上海有限公司 | 无人机路径规划方法、装置、设备和存储介质 |
| US11655028B2 (en) * | 2020-02-19 | 2023-05-23 | General Motors Llc | Reinforcement learning based system for aerial imagery acquisition using drone following target vehicle |
| CN111381499B (zh) * | 2020-03-10 | 2022-09-27 | 东南大学 | 基于三维空间射频地图学习的网联飞行器自适应控制方法 |
| CN111504319A (zh) * | 2020-04-08 | 2020-08-07 | 安徽舒州农业科技有限责任公司 | 一种基于农用无人机的自动驾驶控制方法及系统 |
| JP6950117B1 (ja) * | 2020-04-30 | 2021-10-13 | 楽天グループ株式会社 | 学習装置、情報処理装置、及び学習済の制御モデル |
| CN111580533B (zh) * | 2020-05-07 | 2021-10-15 | 北京邮电大学 | 基于空气动力学的无人机信息收集方法及装置 |
| CN111998847A (zh) * | 2020-07-16 | 2020-11-27 | 西北工业大学 | 一种基于深度强化学习的水下航行器仿生地磁导航方法 |
| CN111880563B (zh) * | 2020-07-17 | 2022-07-15 | 西北工业大学 | 一种基于maddpg的多无人机任务决策方法 |
| CN111950873B (zh) * | 2020-07-30 | 2022-11-15 | 上海卫星工程研究所 | 基于深度强化学习的卫星实时引导任务规划方法及系统 |
| CN114578843B (zh) * | 2020-12-01 | 2024-12-06 | 中移(成都)信息通信科技有限公司 | 飞行路径规划方法、装置、飞行器及存储介质 |
| CN112636811B (zh) * | 2020-12-08 | 2021-11-30 | 北京邮电大学 | 一种中继无人机部署方法及装置 |
| CN112711271B (zh) * | 2020-12-16 | 2022-05-17 | 中山大学 | 基于深度强化学习的自主导航无人机功率优化方法 |
| CN112650058B (zh) * | 2020-12-23 | 2022-07-12 | 西北工业大学 | 一种基于强化学习的四旋翼无人机轨迹控制方法 |
| CN112580537B (zh) * | 2020-12-23 | 2022-06-21 | 中国人民解放军国防科技大学 | 一种用于多无人机系统持续覆盖特定区域的深度强化学习方法 |
| CN112902969B (zh) * | 2021-02-03 | 2023-08-01 | 重庆大学 | 一种无人机在数据收集过程中的路径规划方法 |
| CN112906542B (zh) * | 2021-02-08 | 2023-11-24 | 北京理工大学 | 一种基于强化学习的无人车避障方法及装置 |
| CN113342029B (zh) * | 2021-04-16 | 2022-06-21 | 山东师范大学 | 基于无人机群的最大传感器数据采集路径规划方法及系统 |
| CN113283827B (zh) * | 2021-04-16 | 2024-03-12 | 北京航空航天大学合肥创新研究院(北京航空航天大学合肥研究生院) | 一种基于深度强化学习的两阶段无人机物流路径规划方法 |
| CN113110516B (zh) * | 2021-05-20 | 2023-12-22 | 广东工业大学 | 一种深度强化学习的受限空间机器人作业规划方法 |
| CN113359820A (zh) * | 2021-05-28 | 2021-09-07 | 中国地质大学(武汉) | 一种基于dqn的无人机路径规划方法 |
| CN113436213A (zh) * | 2021-06-23 | 2021-09-24 | 上海极维信息科技有限公司 | 使用强化学习处理定位算法的区域边缘问题的方法 |
| CN113641192B (zh) * | 2021-07-06 | 2023-07-18 | 暨南大学 | 一种基于强化学习的无人机群智感知任务的路径规划方法 |
| CN114021773A (zh) * | 2021-09-26 | 2022-02-08 | 北京百度网讯科技有限公司 | 一种路径规划方法、装置、电子设备以及存储介质 |
| CN113942616B (zh) * | 2021-09-30 | 2023-04-18 | 华能盐城大丰新能源发电有限责任公司 | 一种海上风电场的巡检机构及方法 |
| CN113867396B (zh) * | 2021-10-22 | 2024-04-26 | 吉林大学 | 一种网联无人机航线规划与航线平滑方法及装置 |
| CN114115304B (zh) * | 2021-10-26 | 2024-12-06 | 南京航空航天大学 | 一种航空器四维爬升航迹规划方法及系统 |
| CN114115340B (zh) * | 2021-11-15 | 2024-07-23 | 南京航空航天大学 | 一种基于强化学习的空域协同控制方法 |
| CN114167880A (zh) * | 2021-12-02 | 2022-03-11 | 大连海事大学 | 一种基于时间最优的多水下滑翔机路径规划系统 |
| CN114518758B (zh) * | 2022-02-08 | 2023-12-12 | 中建八局第三建设有限公司 | 基于q学习的室内测量机器人多目标点移动路径规划方法 |
| CN114550540B (zh) * | 2022-02-10 | 2024-08-30 | 北方天途航空技术发展(北京)有限公司 | 一种训练机智能监控方法、装置、设备以及介质 |
| CN114594793B (zh) * | 2022-03-07 | 2023-04-25 | 四川大学 | 一种基站无人机的路径规划方法 |
| CN115032996B (zh) * | 2022-06-21 | 2024-09-06 | 中国电信股份有限公司 | 一种路径规划方法、装置、电子设备及存储介质 |
| CN115167506B (zh) * | 2022-06-27 | 2024-06-28 | 华南师范大学 | 无人机飞行航线更新规划的方法、装置、设备及存储介质 |
| CN115290096B (zh) * | 2022-09-29 | 2022-12-20 | 广东技术师范大学 | 一种基于强化学习差分算法的无人机动态航迹规划方法 |
| CN115562357B (zh) * | 2022-11-23 | 2023-03-14 | 南京邮电大学 | 一种面向无人机集群的智能路径规划方法 |
| CN116402273B (zh) * | 2023-03-01 | 2025-11-18 | 中国电子科技集团公司第二十八研究所 | 一种基于多智能体强化学习的机场滑行智能调度方法 |
| CN116185079B (zh) * | 2023-04-28 | 2023-08-04 | 西安迈远科技有限公司 | 一种基于自适应巡航的无人机施工巡检航线规划方法 |
| CN117806340B (zh) * | 2023-11-24 | 2024-08-30 | 中国电子科技集团公司第十五研究所 | 基于强化学习的空域训练飞行路径自动规划方法和装置 |
| CN118794303B (zh) * | 2024-04-22 | 2025-10-31 | 西北工业大学 | 信息不透明下巡飞弹对机动目标抵近搜索和精确打击方法 |
| CN118674227B (zh) * | 2024-07-04 | 2025-05-06 | 佛山市南海区大数据投资建设有限公司 | 一种基于蚁群算法的无人机巡检调度方法及相关设备 |
| CN118915795B (zh) * | 2024-10-10 | 2025-02-18 | 长江三峡集团实业发展(北京)有限公司 | 一种多无人机协同控制方法及装置 |
| CN119759066A (zh) * | 2025-03-06 | 2025-04-04 | 北方天途航空技术发展(北京)有限公司 | 一种基于云盒远程通讯的无人机控制方法及系统 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106595671A (zh) * | 2017-02-22 | 2017-04-26 | 南方科技大学 | 一种基于强化学习的无人机路径规划方法和装置 |
| WO2018156891A1 (en) * | 2017-02-24 | 2018-08-30 | Google Llc | Training policy neural networks using path consistency learning |
| CN109032168A (zh) * | 2018-05-07 | 2018-12-18 | 西安电子科技大学 | 一种基于dqn的多无人机协同区域监视的航路规划方法 |
| CN109655066A (zh) * | 2019-01-25 | 2019-04-19 | 南京邮电大学 | 一种基于Q(λ)算法的无人机路径规划方法 |
| CN109974737A (zh) * | 2019-04-11 | 2019-07-05 | 山东师范大学 | 基于安全疏散标志和强化学习结合的路径规划方法及系统 |
-
2019
- 2019-10-08 CN CN201910948346.7A patent/CN110673637B/zh active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106595671A (zh) * | 2017-02-22 | 2017-04-26 | 南方科技大学 | 一种基于强化学习的无人机路径规划方法和装置 |
| WO2018156891A1 (en) * | 2017-02-24 | 2018-08-30 | Google Llc | Training policy neural networks using path consistency learning |
| CN109032168A (zh) * | 2018-05-07 | 2018-12-18 | 西安电子科技大学 | 一种基于dqn的多无人机协同区域监视的航路规划方法 |
| CN109655066A (zh) * | 2019-01-25 | 2019-04-19 | 南京邮电大学 | 一种基于Q(λ)算法的无人机路径规划方法 |
| CN109974737A (zh) * | 2019-04-11 | 2019-07-05 | 山东师范大学 | 基于安全疏散标志和强化学习结合的路径规划方法及系统 |
Non-Patent Citations (3)
| Title |
|---|
| Deep Reinforcement Learning for Drone Delivery;Munoz, Guillem等;《DRONES》;20190930;第3卷(第3期);第1-19页 * |
| 一种基于深度学习的禁飞区无人机目标识别方法;虞晓霞等;《长春理工大学学报(自然科学版)》;长春理工大学;20180630;第41卷(第3期);第95-101页 * |
| 基于安全区域模型的飞行机器人电塔巡检路径规划;韩晓雷;《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》;中国学术期刊(光盘版)电子杂志社;20170215(第02期);第1-57页 * |
Also Published As
| Publication number | Publication date |
|---|---|
| CN110673637A (zh) | 2020-01-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110673637B (zh) | 一种基于深度强化学习的无人机伪路径规划的方法 | |
| CN109933086B (zh) | 基于深度q学习的无人机环境感知与自主避障方法 | |
| CN109032168B (zh) | 一种基于dqn的多无人机协同区域监视的航路规划方法 | |
| CN107314772B (zh) | 一种无人机自学习航点轨迹飞行方法及其系统 | |
| Bernardini et al. | Planning the behaviour of low-cost quadcopters for surveillance missions | |
| CN108459616B (zh) | 基于人工蜂群算法的无人机群协同覆盖航路规划方法 | |
| CN114089776B (zh) | 一种基于深度强化学习的无人机避障方法 | |
| CN110502034B (zh) | 一种基于深度强化学习的固定翼无人机群集控制方法 | |
| CN110488859A (zh) | 一种基于改进Q-learning算法的无人机航路规划方法 | |
| CN114815891B (zh) | 一种基于per-idqn的多无人机围捕战术方法 | |
| Li et al. | A UAV path planning method based on deep reinforcement learning | |
| CN109669475A (zh) | 基于人工蜂群算法的多无人机三维编队重构方法 | |
| CN104881043A (zh) | 一种针对多动态目标的多无人机智能协同察打方法 | |
| CN107479572A (zh) | 基于仿生的无人机群组实时路径规划方法 | |
| CN116795138A (zh) | 一种面向数据采集的多无人机智能航迹规划方法 | |
| CN114910072A (zh) | 基于深度强化学习的无人机导航方法、装置、设备及介质 | |
| CN116518974A (zh) | 一种基于空域网格的无冲突航路规划方法 | |
| CN114548663A (zh) | 一种充电无人机为任务无人机空中充电的调度方法 | |
| CN117991804A (zh) | 一种基于改进rrt的高动态固定翼无人机航迹规划方法 | |
| CN110084414B (zh) | 一种基于k次控制深度强化学习的空管防冲突方法 | |
| CN118915772A (zh) | 融合经验共享与平衡奖励Actor-Critic网络的编队路径规划方法 | |
| CN113741186A (zh) | 一种基于近端策略优化的双机空战决策方法 | |
| Beck | Collaborative search and rescue by autonomous robots | |
| CN119148745B (zh) | 基于深度强化学习与时间约束的低空航空器冲突解脱方法 | |
| CN115562347A (zh) | 基于boa-tsar算法的近地配送无人机路径规划方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| CP03 | Change of name, title or address | ||
| CP03 | Change of name, title or address |
Address after: 350000, Fujian, Fuzhou province Minhou County town street, Fuzhou District, the new campus of the School Road Patentee after: Fujian University of Science and Technology Country or region after: China Address before: 350000, Fujian, Fuzhou province Minhou County town street, Fuzhou District, the new campus of the School Road Patentee before: FUJIAN University OF TECHNOLOGY Country or region before: China |
|
| OL01 | Intention to license declared | ||
| OL01 | Intention to license declared |