中国音乐学院电子阅览室

改进式MATD3算法及其对抗应用-指挥控制与仿真2024年05期

改进式MATD3算法及其对抗应用

作者：王琨赵英策王光耀李建勋字体：小中大

打印

摘要：提升多智能体训练效果一直是强化学习领域中的重点。以多智能体双延迟深度确定性策略梯度（MATD3）算法为基础，引入参数共享机制，进而提升训练效率。同时为缓解真实奖励与辅助奖励不一致的问题，借鉴课程学习（试读）...

指挥控制与仿真

2024年第05期

期刊目录