본문 바로가기

Unity

(1)

[Unity, 강화학습, MARL]AI vs AI, 강화학습 기반 Multi-agents 경쟁 시스템 개발 Introducing ⚔️ AI vs. AI ⚔️ a deep reinforcement learning multi-agents competition system 인공지능대 인공지능이 경기를 통해 스스로 학습하는 Multi-agent 강화학습 시스템을 만들어봅시다. AI와 AI 두 agent가 서로 학습하고 경쟁하며 self-learning 합니다. 강화학습 기법으로는 기존 PPO나 SAC 말고 Unity에서 개발한 POCA를 사용합니다. PPO와 SAC에 비해 학습속도와 성능이 월등합니다. Unity의 ml-agents를 사용하여 torch로 강화학습을 합니다. 직접 학습한 축구AI로 다른 사람들과 경기해 볼 수 있어요:) 1) Reference ref1 ref2 2) 환경셋팅 2.1) Anaconda ..

이전 1 다음

티스토리툴바