CN108803313A - 一种基于海流预测模型的路径规划方法 - Google Patents
一种基于海流预测模型的路径规划方法 Download PDFInfo
- Publication number
- CN108803313A CN108803313A CN201810589190.3A CN201810589190A CN108803313A CN 108803313 A CN108803313 A CN 108803313A CN 201810589190 A CN201810589190 A CN 201810589190A CN 108803313 A CN108803313 A CN 108803313A
- Authority
- CN
- China
- Prior art keywords
- ocean current
- current
- action
- ocean
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000009471 action Effects 0.000 claims abstract description 53
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 30
- 238000005070 sampling Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 3
- 210000002364 input neuron Anatomy 0.000 claims description 3
- 210000004205 output neuron Anatomy 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 230000004888 barrier function Effects 0.000 claims 3
- 230000000875 corresponding effect Effects 0.000 claims 3
- 230000001537 neural effect Effects 0.000 claims 1
- 230000002787 reinforcement Effects 0.000 abstract description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005265 energy consumption Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000009189 diving Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/048—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Feedback Control In General (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明属于水下机器人控制领域,公开了一种基于海流预测模型的路径规划方法,包含如下步骤:根据路径关键点对航行区域进行栅格化处理;利用区域海洋模式对航行区域进行海流预测,拟合计算得到实时的海流信息;利用电子海图信息标记禁航区;将不同深度的禁航信息和起点终点位置信息按照不同深度的平面栅格进行存储栅格各点的经纬度、是否为禁航区、是否到达终点;计算当前位置到终点的方向并在所有下一步行驶方向中确定可选动作;使用Q学习寻求马尔科夫决策过程规划的最优策略并输出路径。本发明充分考虑实时的海流对路径规划的影响,通过BP神经网络和bagging算法进行拟合,使用强化学习来寻求最优解,加快收敛速度,降低运算的复杂度。
Description
技术领域
本发明属于水下机器人控制领域,尤其涉及一种基于海流预测模型的路径规划方法。
背景技术
水下机器人也称无人遥控潜水器,是一种工作于水下的极限作业机器人。水下环境恶劣危险,人的潜水深度有限,所以水下机器人已成为开发海洋的重要工具。
水下机器人可在高度危险环境、被污染环境以及零可见度的水域代替人工在水下长时间作业,水下机器人上一般配备声呐系统、摄像机、照明灯和机械臂等装置,能提供实时视频、声呐图像,机械臂能抓起重物,水下机器人在石油开发、海事执法取证、科学研究和军事等领域得到广泛应用。
由于水下机器人运行的环境复杂,水声信号的噪声大,而各种水声传感器普遍存在精度较差、跳变频繁的缺点,因此水下机器人运动控制系统中,滤波技术显得极为重要。水下机器人运动控制中普遍采用的位置传感器为短基线或长基线水声定位系统,速度传感器为多普勒速度计会影响水声定位系统精度。因素主要包括声速误差、应答器响应时间的丈量误差、应答器位置即间距的校正误差。而影响多普勒速度计精度的因素主要包括声速c、海水中的介质物理化学特性、运载器的颠簸等
因此路径规划对水下机器人显得尤为重要。路径规划是水下机器人智能导航基本环节之一。水下机器人在大范围海洋环境下航行时,除考虑避障、能耗问题外,还需考虑海洋环境对水下机器人航行的影响。随时间变化的海流给水下机器人的安全及任务实现带来很大挑战,因此在进行路径规划时,需通过预测的海流要素,使水下机器人尽量利用流场中的能量,规划出能耗少的可行的安全路径。
从算法策略角度,目前路径规划算法可分为基于智能计算的路径规划,基于行为、学习心理的路径规划和随机采样路径规划。这些算法目的多是提高解空间搜索效率、加快收敛,或是针对未知环境或动态空间提出的,且目前越来越多的学者开始海流影响下的路径规划的研究。从流函数生成海流场到海流历史统计数据库生成海流场,本发明是利用区域海洋模式来预测某地区未来时刻海流场数据和AUV位姿及控制指令,来实时预测海流,使用来做路径规划的海流场更加精确,更具有实时性。
申请号为201710538828.6的专利公开了一种基于探测威胁域的无人潜航器路径规划装置及方法,基于探测威胁域的路径规划算法来解决地形障碍环境下UUV的路径规划问题,能满足UUV本身运动学约束、避碰约束以及隐蔽探测约束。在给定初始位置、终点位置、最大曲率约束、路径离散点分辨率、隐蔽安全指标等,规划出从运动起点到终点的路径,且光滑连续可导,满足UUV的航行转弯曲率约束、隐蔽安全指标等,使其以最短时间安全隐蔽到达终点。本发明首次将探测威胁理论与航行转弯曲率约束的几何理论应用到UUV的路径规划领域中,能快速实现路径规划,方法简单可靠,易于实现,计算量小,实时性较好,能满足路径规划要求,提高了路径规划的实用性,对今后水下路径规划领域的发展有着积极意义。但该方法应用在水下航行器的路径规划时,存在计算过程过于复杂,实时性不好的问题。
发明内容
本发明的目的在于公开能耗少,安全性高的一种基于海流预测模型的路径规划方法。
本发明的目的是这样实现的:
一种基于海流预测模型的路径规划方法,包含如下步骤:
步骤(1):根据路径关键点确定航行区域,并对航行区域进行栅格化处理;
步骤(2):利用区域海洋模式对航行区域进行时间步长为ΔT的海流预测,根据AUV实时位姿变化、控制指令和对应时刻的海流信息,利用bagging算法和BP神经网络进行拟合,计算得到实时的海流信息:
将控制指令对应上一时刻AUV位姿和此时刻AUV位姿及海流信息,使用bagging算法,生成T个训练集,T个BP神经网络基于每个采样集训练出T个基学习器,BP神经网络为三层,输入为上一时刻AUV的速度大小与角度、舵和翼及推进器的电压、此时刻AUV的速度大小和角度,输出为海流的经向速度和纬向速度,输入层为7个输入神经元、2个输出神经元,隐层神经元个数取5、8、10、12和15中的一个,通过10折交叉验证法确定隐层个数,并根据误差率按比例求得最终实时海流要素,将此时刻求得的海流要素当做下一时刻的海流要素,得到实时的海流信息。
步骤(3):利用电子海图信息,将危及水下机器人安全航行的区域在栅格中标记为禁航区;
步骤(4):将不同深度的禁航信息和起点终点位置信息按照不同深度的平面栅格进行存储存储栅格各点的经纬度、是否为禁航区、是否到达终点;
步骤(5):计算当前位置到终点的方向并在所有下一步行驶方向中确定可选动作:
根据矩形网格结构图,假设矩形网格中间的黑点为水下机器人的当前位置,且当前动作有a1、a2到a16共16种可能,可能的动作为从当前水下机器人位置到其外两层位置的动作,假设执行当前某个动作后所在的位置在禁航区;
设ast为当前点位置到目标点位置的动作,动作选择公式如下:
上式中,i为整数,且i∈[1,16];选择Ai>0的动作,若障碍物在当前点最近8个格点,则障碍物所在格点对应的动作和相邻动作都舍弃;若障碍物在当前点外一层格点处,则只有存在障碍物的格点对应的动作舍弃。
步骤(6):采用重点式学习方式,使用Q学习寻求马尔科夫决策过程规划的最优策略并输出路径。
步骤(6.1):初始化值函数Q(s,a)=0,初始化原始策略π(s,a)=argmaxa Q(s,a);
步骤(6.2):初始化状态S0为初始位置,确定初始时间t0;
步骤(6.3):通过神经网络计算当前位置的实时的海流速度;
步骤(6.4):运用重点探索策略选择动作a,产生奖励rt+1,转移到状态St+1:
重点探索策略μ(x):
上式中,
上式中,w1是距离影响的权重系数,w2是海流影响的权重系数;vc是t时刻当前位置所在格点的海流速度,ai是概率为pi的可选动作。
步骤(6.5):根据原始策略π,在状态St+1选择并执行动作at+1。
步骤(6.6):更新状态动作值函数的函数值:
Q(st,at)←Q(st,at)+β[rt+1+γQ(st+1,at+1)-Q(st,at)];
上式中,β表示学习速率,取值范围为[0,1];γ表示折扣因子。
步骤(6.7):利用贪婪策略更新当前策略
步骤(6.8):判断水下机器人是否到达目标位置的状态,若未到达转步骤(6.3),若到达目标状态则转步骤(6.9)。
步骤(6.9):判断是否达到迭代次数或是否所有状态动作值函数收敛,若未到达迭代次数或状态动作值函数未均收敛则转步骤(6.2);若到达迭代次数或所有动作值函数都收敛则输出最优策略,得到最优规划路径。
本发明的有益效果为:
本发明充分考虑实时的海流对路径规划的影响,通过区域海洋模式预测未来的海洋要素,利用BP神经网络和bagging算法进行拟合,得到实时的海流信息。同时根据马尔科夫决策过程进行规划,使用强化学习来寻求最优解,加快收敛速度,降低运算的复杂度,更好更快地得到规划路径。
附图说明
图1是一种基于海流预测模型的路径规划方法流程图;
图2是矩形网格结构图;
图3是动作选择示意图;
图4是马尔科夫决策过程规划流程图。
具体实施方式
下面结合附图来进一步描述本发明:
实施例1:
如图1,一种基于海流预测模型的路径规划方法,包含如下步骤:
步骤(1):根据路径关键点确定航行区域,并对航行区域进行栅格化处理;
根据水下机器人路径的起点终点确定矩形航行区域;水平方向采用正交曲线网格,设定格距范围在2km~30km,垂直方向等深划分20~30层。
步骤(2):利用区域海洋模式对航行区域进行时间步长为ΔT的海流预测,根据AUV实时位姿变化、控制指令和对应时刻的海流信息,利用bagging算法和BP神经网络进行拟合,计算得到实时的海流信息:
垂直方向采用σ坐标,通过垂向变换函数和拉伸函数将垂向坐标尺度控制在[-1,0],设置垂向划分的层数;
垂向变换函数:
z(x,y,s,t)=η(x,y,t)+[η(x,y,t)+h(x,y)]×Z0(x,y,s);
上式中,z是笛卡尔坐标系的高度,x是经线坐标值,y是纬线坐标值,s是距离水面的垂向距离,t是时间,η(x,y,t)是随时间变化的自由海面,h(x,y)时未扰动的水体厚度,hc是转换参数;
拉伸函数:
上式中,θs是表面控制参数,0<θs≤10。
区域海洋模式初始条件由四维同化实现,边界条件由全球模式的预报场经差分而来,空间上采用中央差分格式,时间上采用蛙跳格式,设置时间步长为5min,对航行区域的海流场进行预测并保存在文件中。
将控制指令对应上一时刻AUV位姿和此时刻AUV位姿及海流信息,使用bagging算法,生成T个训练集,T个BP神经网络基于每个采样集训练出T个基学习器,BP神经网络为三层,输入为上一时刻AUV的速度大小与角度、舵和翼及推进器的电压、此时刻AUV的速度大小和角度,输出为海流的经向速度和纬向速度,输入层为7个输入神经元、2个输出神经元,隐层神经元个数取5、8、10、12和15中的一个,通过10折交叉验证法确定隐层个数,并根据误差率按比例求得最终实时海流要素,将此时刻求得的海流要素当做下一时刻的海流要素,得到实时的海流信息。
步骤(3):利用电子海图信息,将危及水下机器人安全航行的区域在栅格中标记为禁航区;
步骤(4):将不同深度的禁航信息和起点终点位置信息按照不同深度的平面栅格进行存储存储栅格各点的经纬度、是否为禁航区、是否到达终点;
步骤(5):计算当前位置到终点的方向并在所有下一步行驶方向中确定可选动作:
如图2,根据矩形网格结构图,假设矩形网格中间的黑点为水下机器人的当前位置,且当前动作有a1、a2到a16共16种可能,可能的动作为从当前水下机器人位置到其外两层位置的动作,假设执行当前某个动作后所在的位置在禁航区;
如图3,设ast为当前点位置到目标点位置的动作,动作选择公式如下:
上式中,i为整数,且i∈[1,16];选择Ai>0的动作,若障碍物在当前点最近8个格点,则障碍物所在格点对应的动作和相邻动作都舍弃;若障碍物在当前点外一层格点处,则只有存在障碍物的格点对应的动作舍弃。
步骤(6):采用重点式学习方式,使用Q学习寻求马尔科夫决策过程规划的最优策略并输出路径:
马尔科夫决策过程由五元组(S,A,P,R,γ)描述,其中:
S为有限状态集,A为有限动作集,P为状态转移概率,R为回报函数,γ为折扣因子,用来计算累计回报。
强化学习的目标是给定一个马尔科夫决策过程,寻求最优策略。所谓策略是指状态到动作的映射,常用符号π表示。水下机器人通过对未知环境用策略探索动作根据回报优化策略来规划最优路径,当一个动作产生正回报时,动作被加强,下次再出现相同状态时则会有大概率选择该动作,反之动作被削弱,通过不断与环境交互来寻求最优策略。由于其固有的适应能力、反应能力和在线学习能力多被用在未知环境的路径规划中,其中Q学习应用最广泛。具体步骤如图4所示。
步骤(6.1):初始化值函数Q(s,a)=0,初始化原始策略π(s,a)=argmaxa Q(s,a);
步骤(6.2):初始化状态S0为初始位置,确定初始时间t0;
步骤(6.3):通过神经网络计算当前位置的实时的海流速度;
步骤(6.4):运用重点探索策略选择动作a,产生奖励rt+1,转移到状态St+1:
重点探索策略:
上式中,
上式中,w1是距离影响的权重系数,w2是海流影响的权重系数;vc是t时刻当前位置所在格点的海流速度,ai是概率为pi的可选动作;
立即奖励函数:
上式中,wd是距离奖惩函数的权重系数,wr是危险奖惩函数的权重系数,wc是海流奖惩函数的权重系数;
距离奖惩函数rd=d(t)-d(t+1),d(t)表示t时刻机器人位置到目标点的距离,d(t+1)表示t+1时刻机器人位置到目标点的距离。
危险奖惩函数:
上式中,do是水下机器人当前位置与障碍物之间的格距;
海流奖惩函数rc=vccos|α-θ|,α是航向角,θ是海流方向;
根据重点探索策略选择的动作a,产生奖励rt+1,转移到状态St+1;
步骤(6.5):根据原始策略π,在状态St+1选择并执行动作at+1。
步骤(6.6):更新状态动作值函数的函数值:
Q(st,at)←Q(st,at)+β[rt+1+γQ(st+1,at+1)-Q(st,at)];
上式中,β表示学习速率,取值范围为[0,1];γ表示折扣因子。
步骤(6.7):利用贪婪策略更新当前策略
步骤(6.8):判断水下机器人是否到达目标位置的状态,若未到达转步骤(6.3),若到达目标状态则转步骤(6.9)。
步骤(6.9):判断是否达到迭代次数或是否所有状态动作值函数收敛,若未到达迭代次数或状态动作值函数未均收敛则转步骤(6.2);若到达迭代次数或所有动作值函数都收敛则输出最优策略,得到最优规划路径。
与现有技术相比,本发明充分考虑实时的海流对路径规划的影响,通过区域海洋模式预测未来的海洋要素,利用BP神经网络和bagging算法进行拟合,得到实时的海流信息。同时根据马尔科夫决策过程进行规划,使用强化学习来寻求最优解,加快收敛速度,降低运算的复杂度,更好更快地得到规划路径。
以上所述并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于海流预测模型的路径规划方法,其特征在于:包含如下步骤:
步骤(1):根据路径关键点确定航行区域,并对航行区域进行栅格化处理;
步骤(2):利用区域海洋模式对航行区域进行时间步长为ΔT的海流预测,根据AUV实时位姿变化、控制指令和对应时刻的海流信息,利用bagging算法和BP神经网络进行拟合,计算得到实时的海流信息;
步骤(3):利用电子海图信息,将危及水下机器人安全航行的区域在栅格中标记为禁航区;
步骤(4):将不同深度的禁航信息和起点终点位置信息按照不同深度的平面栅格进行存储存储栅格各点的经纬度、是否为禁航区、是否到达终点;
步骤(5):计算当前位置到终点的方向并在所有下一步行驶方向中确定可选动作;
步骤(6):采用重点式学习方式,使用Q学习寻求马尔科夫决策过程规划的最优策略并输出路径。
2.根据权利要求1所述的一种基于海流预测模型的路径规划方法,其特征在于:所述的步骤(2)具体为:
将控制指令对应上一时刻AUV位姿和此时刻AUV位姿及海流信息,使用bagging算法,生成T个训练集,T个BP神经网络基于每个采样集训练出T个基学习器,BP神经网络为三层,输入为上一时刻AUV的速度大小与角度、舵和翼及推进器的电压、此时刻AUV的速度大小和角度,输出为海流的经向速度和纬向速度,输入层为7个输入神经元、2个输出神经元,隐层神经元个数取5、8、10、12和15中的一个,通过10折交叉验证法确定隐层个数,并根据误差率按比例求得最终实时海流要素,将此时刻求得的海流要素当做下一时刻的海流要素,得到实时的海流信息。
3.根据权利要求1所述的一种基于海流预测模型的路径规划方法,其特征在于:所述的步骤(5)具体为:
根据矩形网格结构图,假设矩形网格中间的黑点为水下机器人的当前位置,且当前动作有a1、a2到a16共16种可能,可能的动作为从当前水下机器人位置到其外两层位置的动作,假设执行当前某个动作后所在的位置在禁航区;
设ast为当前点位置到目标点位置的动作,动作选择公式如下:
上式中,i为整数,且i∈[1,16];选择Ai>0的动作,若障碍物在当前点最近8个格点,则障碍物所在格点对应的动作和相邻动作都舍弃;若障碍物在当前点外一层格点处,则只有存在障碍物的格点对应的动作舍弃。
4.根据权利要求1所述的一种基于海流预测模型的路径规划方法,其特征在于:所述的步骤(6)包括如下步骤:
步骤(6.1):初始化值函数Q(s,a)=0,初始化原始策略π(s,a)=argmaxa Q(s,a);
步骤(6.2):初始化状态S0为初始位置,确定初始时间t0;
步骤(6.3):通过神经网络计算当前位置的实时的海流速度;
步骤(6.4):运用重点探索策略选择动作a,产生奖励rt+1,转移到状态St+1:
步骤(6.5):根据原始策略π,在状态St+1选择并执行动作at+1;
步骤(6.6):更新状态动作值函数的函数值:
Q(st,at)←Q(st,at)+β[rt+1+γQ(st+1,at+1)-Q(st,at)];
上式中,β表示学习速率,取值范围为[0,1];γ表示折扣因子;
步骤(6.7):利用贪婪策略更新当前策略
步骤(6.8):判断水下机器人是否到达目标位置的状态,若未到达转步骤(6.3),若到达目标状态则转步骤(6.9);
步骤(6.9):判断是否达到迭代次数或是否所有状态动作值函数收敛,若未到达迭代次数或状态动作值函数未均收敛则转步骤(6.2);若到达迭代次数或所有动作值函数都收敛则输出最优策略,得到最优规划路径。
5.根据权利要求4所述的一种基于海流预测模型的路径规划方法,其特征在于:所述的重点探索策略μ(x):
上式中,
上式中,w1是距离影响的权重系数,w2是海流影响的权重系数;vc是t时刻当前位置所在格点的海流速度,ai是概率为pi的可选动作。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810589190.3A CN108803313B (zh) | 2018-06-08 | 2018-06-08 | 一种基于海流预测模型的路径规划方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810589190.3A CN108803313B (zh) | 2018-06-08 | 2018-06-08 | 一种基于海流预测模型的路径规划方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN108803313A true CN108803313A (zh) | 2018-11-13 |
| CN108803313B CN108803313B (zh) | 2022-07-12 |
Family
ID=64088958
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201810589190.3A Active CN108803313B (zh) | 2018-06-08 | 2018-06-08 | 一种基于海流预测模型的路径规划方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN108803313B (zh) |
Cited By (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109445437A (zh) * | 2018-11-30 | 2019-03-08 | 电子科技大学 | 一种无人电动车的路径规划方法 |
| CN109657863A (zh) * | 2018-12-20 | 2019-04-19 | 智慧航海(青岛)科技有限公司 | 一种基于萤火虫算法的无人船全局路径动态优化方法 |
| CN109726866A (zh) * | 2018-12-27 | 2019-05-07 | 浙江农林大学 | 基于q学习神经网络的无人船路径规划方法 |
| CN110543171A (zh) * | 2019-08-27 | 2019-12-06 | 华中科技大学 | 一种基于改进bp神经网络的仓储多agv路径规划方法 |
| CN110555584A (zh) * | 2019-07-17 | 2019-12-10 | 浙江工业大学 | 一种基于深度强化学习的自动化停车场调度方法 |
| CN110569443A (zh) * | 2019-03-11 | 2019-12-13 | 北京航空航天大学 | 一种基于强化学习的自适应学习路径规划系统 |
| CN110763234A (zh) * | 2019-10-15 | 2020-02-07 | 哈尔滨工程大学 | 一种水下机器人海底地形匹配导航路径规划方法 |
| CN111645079A (zh) * | 2020-08-04 | 2020-09-11 | 天津滨电电力工程有限公司 | 一种带电作业机器人机械臂路径规划控制装置及其方法 |
| CN111958601A (zh) * | 2020-08-19 | 2020-11-20 | 西南交通大学 | 一种基于深度学习的自动化寻径与物料识别方法 |
| CN112215395A (zh) * | 2020-09-02 | 2021-01-12 | 中国船舶重工集团公司第七研究院 | 一种基于海洋大数据的水下装备适应性信息保障系统 |
| CN112581026A (zh) * | 2020-12-29 | 2021-03-30 | 杭州趣链科技有限公司 | 一种联盟链上物流机器人联合路径规划方法 |
| CN112698646A (zh) * | 2020-12-05 | 2021-04-23 | 西北工业大学 | 一种基于强化学习的航行器路径规划方法 |
| CN113052370A (zh) * | 2021-03-15 | 2021-06-29 | 哈尔滨工程大学 | 一种基于时空经验正交函数的海洋环境要素统计预测方法 |
| CN113064440A (zh) * | 2021-03-15 | 2021-07-02 | 哈尔滨工程大学 | 一种基于海洋模式的自适应观测方法 |
| CN113325856A (zh) * | 2021-05-31 | 2021-08-31 | 中国船舶工业集团公司第七0八研究所 | 基于逆流逼近策略的uuv最优作业路径规划方法 |
| CN114200929A (zh) * | 2021-11-24 | 2022-03-18 | 中国科学院沈阳自动化研究所 | 多水下机器人最大探测覆盖率的快速梳型路径规划方法 |
| CN114997363A (zh) * | 2022-04-24 | 2022-09-02 | 中国人民解放军国防科技大学 | 一种声呐测深数据自动修正方法、装置及存储介质 |
| CN116700315A (zh) * | 2023-07-03 | 2023-09-05 | 苏州优世达智能科技有限公司 | 一种无人艇的航迹跟踪控制方法及系统 |
| CN116929372A (zh) * | 2023-07-31 | 2023-10-24 | 哈尔滨工程大学 | 基于多能源捕耗建模的海洋机器人路径规划方法及系统 |
| CN118674125A (zh) * | 2024-08-22 | 2024-09-20 | 广东海洋大学 | 一种目标海域的海流能预测方法及系统 |
| CN119759027A (zh) * | 2024-12-26 | 2025-04-04 | 哈尔滨工程大学 | 考虑流致位置偏差的海洋机器人避障轨迹规划方法与系统 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2006122030A2 (en) * | 2005-05-07 | 2006-11-16 | Thaler Stephen L | Device for the autonomous bootstrapping of useful information |
| CN102175245A (zh) * | 2011-01-28 | 2011-09-07 | 哈尔滨工程大学 | 一种基于海流历史统计信息的水下潜器路径规划方法 |
| CN102799179A (zh) * | 2012-07-06 | 2012-11-28 | 山东大学 | 基于单链序贯回溯q学习的移动机器人路径规划算法 |
| CN102819264A (zh) * | 2012-07-30 | 2012-12-12 | 山东大学 | 移动机器人路径规划q学习初始化方法 |
| CN106970615A (zh) * | 2017-03-21 | 2017-07-21 | 西北工业大学 | 一种深度强化学习的实时在线路径规划方法 |
| CN107748566A (zh) * | 2017-09-20 | 2018-03-02 | 清华大学 | 一种基于强化学习的水下自主机器人固定深度控制方法 |
-
2018
- 2018-06-08 CN CN201810589190.3A patent/CN108803313B/zh active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2006122030A2 (en) * | 2005-05-07 | 2006-11-16 | Thaler Stephen L | Device for the autonomous bootstrapping of useful information |
| CN102175245A (zh) * | 2011-01-28 | 2011-09-07 | 哈尔滨工程大学 | 一种基于海流历史统计信息的水下潜器路径规划方法 |
| CN102799179A (zh) * | 2012-07-06 | 2012-11-28 | 山东大学 | 基于单链序贯回溯q学习的移动机器人路径规划算法 |
| CN102819264A (zh) * | 2012-07-30 | 2012-12-12 | 山东大学 | 移动机器人路径规划q学习初始化方法 |
| CN106970615A (zh) * | 2017-03-21 | 2017-07-21 | 西北工业大学 | 一种深度强化学习的实时在线路径规划方法 |
| CN107748566A (zh) * | 2017-09-20 | 2018-03-02 | 清华大学 | 一种基于强化学习的水下自主机器人固定深度控制方法 |
Non-Patent Citations (2)
| Title |
|---|
| 曹江丽: "水下机器人路径规划问题的关键技术研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
| 董世超: "基于ARIMA_BP神经网络模型海流流速预测研究", 《中国科技信息》 * |
Cited By (29)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109445437A (zh) * | 2018-11-30 | 2019-03-08 | 电子科技大学 | 一种无人电动车的路径规划方法 |
| CN109657863A (zh) * | 2018-12-20 | 2019-04-19 | 智慧航海(青岛)科技有限公司 | 一种基于萤火虫算法的无人船全局路径动态优化方法 |
| CN109726866A (zh) * | 2018-12-27 | 2019-05-07 | 浙江农林大学 | 基于q学习神经网络的无人船路径规划方法 |
| CN110569443A (zh) * | 2019-03-11 | 2019-12-13 | 北京航空航天大学 | 一种基于强化学习的自适应学习路径规划系统 |
| CN110569443B (zh) * | 2019-03-11 | 2022-05-17 | 北京航空航天大学 | 一种基于强化学习的自适应学习路径规划系统 |
| CN110555584B (zh) * | 2019-07-17 | 2021-04-06 | 浙江工业大学 | 一种基于深度强化学习的自动化停车场调度方法 |
| CN110555584A (zh) * | 2019-07-17 | 2019-12-10 | 浙江工业大学 | 一种基于深度强化学习的自动化停车场调度方法 |
| CN110543171A (zh) * | 2019-08-27 | 2019-12-06 | 华中科技大学 | 一种基于改进bp神经网络的仓储多agv路径规划方法 |
| CN110763234A (zh) * | 2019-10-15 | 2020-02-07 | 哈尔滨工程大学 | 一种水下机器人海底地形匹配导航路径规划方法 |
| CN111645079A (zh) * | 2020-08-04 | 2020-09-11 | 天津滨电电力工程有限公司 | 一种带电作业机器人机械臂路径规划控制装置及其方法 |
| CN111958601A (zh) * | 2020-08-19 | 2020-11-20 | 西南交通大学 | 一种基于深度学习的自动化寻径与物料识别方法 |
| CN112215395A (zh) * | 2020-09-02 | 2021-01-12 | 中国船舶重工集团公司第七研究院 | 一种基于海洋大数据的水下装备适应性信息保障系统 |
| CN112698646A (zh) * | 2020-12-05 | 2021-04-23 | 西北工业大学 | 一种基于强化学习的航行器路径规划方法 |
| CN112581026A (zh) * | 2020-12-29 | 2021-03-30 | 杭州趣链科技有限公司 | 一种联盟链上物流机器人联合路径规划方法 |
| CN113064440A (zh) * | 2021-03-15 | 2021-07-02 | 哈尔滨工程大学 | 一种基于海洋模式的自适应观测方法 |
| CN113064440B (zh) * | 2021-03-15 | 2022-08-02 | 哈尔滨工程大学 | 一种基于海洋模式的自适应观测方法 |
| CN113052370A (zh) * | 2021-03-15 | 2021-06-29 | 哈尔滨工程大学 | 一种基于时空经验正交函数的海洋环境要素统计预测方法 |
| CN113325856A (zh) * | 2021-05-31 | 2021-08-31 | 中国船舶工业集团公司第七0八研究所 | 基于逆流逼近策略的uuv最优作业路径规划方法 |
| CN114200929B (zh) * | 2021-11-24 | 2023-10-20 | 中国科学院沈阳自动化研究所 | 多水下机器人最大探测覆盖率的快速梳型路径规划方法 |
| CN114200929A (zh) * | 2021-11-24 | 2022-03-18 | 中国科学院沈阳自动化研究所 | 多水下机器人最大探测覆盖率的快速梳型路径规划方法 |
| CN114997363A (zh) * | 2022-04-24 | 2022-09-02 | 中国人民解放军国防科技大学 | 一种声呐测深数据自动修正方法、装置及存储介质 |
| CN114997363B (zh) * | 2022-04-24 | 2025-09-19 | 中国人民解放军国防科技大学 | 一种声呐测深数据自动修正方法、装置及存储介质 |
| CN116700315A (zh) * | 2023-07-03 | 2023-09-05 | 苏州优世达智能科技有限公司 | 一种无人艇的航迹跟踪控制方法及系统 |
| CN116700315B (zh) * | 2023-07-03 | 2024-02-06 | 苏州优世达智能科技有限公司 | 一种无人艇的航迹跟踪控制方法及系统 |
| CN116929372A (zh) * | 2023-07-31 | 2023-10-24 | 哈尔滨工程大学 | 基于多能源捕耗建模的海洋机器人路径规划方法及系统 |
| CN116929372B (zh) * | 2023-07-31 | 2024-08-09 | 哈尔滨工程大学 | 基于多能源捕耗建模的海洋机器人路径规划方法及系统 |
| CN118674125A (zh) * | 2024-08-22 | 2024-09-20 | 广东海洋大学 | 一种目标海域的海流能预测方法及系统 |
| CN118674125B (zh) * | 2024-08-22 | 2024-12-20 | 广东海洋大学 | 一种目标海域的海流能预测方法及系统 |
| CN119759027A (zh) * | 2024-12-26 | 2025-04-04 | 哈尔滨工程大学 | 考虑流致位置偏差的海洋机器人避障轨迹规划方法与系统 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN108803313B (zh) | 2022-07-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108803313B (zh) | 一种基于海流预测模型的路径规划方法 | |
| Ning et al. | COLREGs-compliant unmanned surface vehicles collision avoidance based on multi-objective genetic algorithm | |
| Liu et al. | Self-adaptive dynamic obstacle avoidance and path planning for USV under complex maritime environment | |
| Chen et al. | A hybrid path planning algorithm for unmanned surface vehicles in complex environment with dynamic obstacles | |
| Wang et al. | A COLREGs-based obstacle avoidance approach for unmanned surface vehicles | |
| Junmin et al. | Mechanism of dynamic automatic collision avoidance and the optimal route in multi-ship encounter situations | |
| CN105807769B (zh) | 无人水下航行器ivfh避碰方法 | |
| Wu et al. | An overview of developments and challenges for unmanned surface vehicle autonomous berthing | |
| CN109784201B (zh) | 基于四维风险评估的auv动态避障方法 | |
| CN114610046B (zh) | 一种考虑动态水深的无人艇动态安全轨迹规划方法 | |
| CN111273670A (zh) | 一种针对快速移动障碍物的无人艇避碰方法 | |
| Lexau et al. | Automated docking for marine surface vessels—a survey | |
| CN107037809A (zh) | 一种基于改进蚁群算法的无人艇避碰方法 | |
| CN116300906A (zh) | 一种智能船的避障路径规划方法及系统 | |
| CN119356348A (zh) | 一种无人艇协同编队控制方法 | |
| Liu et al. | PE-A* algorithm for ship route planning based on field theory | |
| Liang et al. | Economic MPC-based planning for marine vehicles: Tuning safety and energy efficiency | |
| Li et al. | Dynamic trajectory planning for unmanned ship under multi-object environment | |
| Zhao et al. | Dynamic adaptive decision-making method for autonomous navigation of ships in coastal waters | |
| CN118311968A (zh) | 一种无人艇编队跟踪及避障控制方法 | |
| Zhang et al. | Path planning of USV in confined waters based on improved A∗ and DWA fusion algorithm | |
| Hadi et al. | Cooperative motion planning and control of a group of autonomous underwater vehicles using twin-delayed deep deterministic policy gradient | |
| CN115373383A (zh) | 一种垃圾回收无人艇的自主避障方法、装置及相关设备 | |
| Wen et al. | Intelligent decision-Making method for AUV path planning against ocean current disturbance via reinforcement learning | |
| CN114387822A (zh) | 船舶避碰方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |