• 简体   /   繁体
基于深度确定性策略梯度的船舶自主航行避碰方法-指挥控制与仿真2024年05期

基于深度确定性策略梯度的船舶自主航行避碰方法

作者:胡正阳 王勇 字体:      

摘 要:针对不同会遇态势下的船舶自主航行避碰决策问题,在DDPG(Deep Deterministic Policy Gradient)算法基础上,以国际航行规则(COLREGS)为基准设计相应的奖励函数,通过引入势能回报塑形的思想来引导智能体学(试读)...

指挥控制与仿真

2024年第05期