• 简体   /   繁体
改进式MATD3算法及其对抗应用-指挥控制与仿真2024年05期

改进式MATD3算法及其对抗应用

作者:王琨 赵英策 王光耀 李建勋 字体:      

摘 要:提升多智能体训练效果一直是强化学习领域中的重点。以多智能体双延迟深度确定性策略梯度(MATD3)算法为基础,引入参数共享机制,进而提升训练效率。同时为缓解真实奖励与辅助奖励不一致的问题,借鉴课程学习(试读)...

指挥控制与仿真

2024年第05期