中国音乐学院电子阅览室

基于深度确定性策略梯度的船舶自主航行避碰方法-指挥控制与仿真2024年05期

基于深度确定性策略梯度的船舶自主航行避碰方法

作者：胡正阳王勇字体：小中大

打印

摘要：针对不同会遇态势下的船舶自主航行避碰决策问题，在DDPG（Deep Deterministic Policy Gradient）算法基础上，以国际航行规则（COLREGS）为基准设计相应的奖励函数，通过引入势能回报塑形的思想来引导智能体学（试读）...

指挥控制与仿真

2024年第05期

期刊目录