一、开题答辩题目: 多智能体协同和对抗策略的博弈强化学习方法研究
二、开题答辩人:冀孟达
三、开题答辩时间:2024年7月5日 下午14:30
四、开题答辩地点:西北工业大学友谊校区物资楼204会议室
五、开题内容简介:
围绕无人集群在智能博弈决策上的需求,本研究主要运用博弈理论分析和设计多智能体深度强化学习算法,通过智能体与环境的交互经验数据学习群体的策略性行为。针对集群与外部敌手的非合作博弈场景,基于均衡理论分析和设计多智能体强化学习算法,改善对抗策略的学习效率;针对集群内部多智能体的协同策略,利用合作博弈理论和多任务学习机制设计基于价值分解的多智能体强化学习算法,激励多智能体学习团队最优策略,解决联合价值网络维度高、分解价值网络分配不稳定的问题。相关研究将有助于多智能体博弈决策的发展,对于无人集群决策尤其是复杂感知系统博弈决策具有重要价值。
六、开题答辩人简介
冀孟达,男,西北工业大学无人系统技术研究院智能无人系统科学与技术专业,2021级在读博士研究生,主要研究方向为博弈论、语言模型与多智能体强化学习,及其在无人系统中的应用。