본문 바로가기

pytorch

(4)
[Unity, 강화학습, MARL]AI vs AI, 강화학습 기반 Multi-agents 경쟁 시스템 개발 Introducing ⚔️ AI vs. AI ⚔️ a deep reinforcement learning multi-agents competition system 인공지능대 인공지능이 경기를 통해 스스로 학습하는 Multi-agent 강화학습 시스템을 만들어봅시다. AI와 AI 두 agent가 서로 학습하고 경쟁하며 self-learning 합니다. 강화학습 기법으로는 기존 PPO나 SAC 말고 Unity에서 개발한 POCA를 사용합니다. PPO와 SAC에 비해 학습속도와 성능이 월등합니다. Unity의 ml-agents를 사용하여 torch로 강화학습을 합니다. 직접 학습한 축구AI로 다른 사람들과 경기해 볼 수 있어요:) 1) Reference ref1 ref2 2) 환경셋팅 2.1) Anaconda ..
딥러닝을 OpenCV에서 쉽게 쓰자 난 주로 Pytorch를 쓴다. 근데 문제는 torch에서 개발한 모델파일을 C, C## 등 다른 플랫폼에서 쓰고싶다. 물론 ONNX, Torchscript가 있지만 이상하게 손이 안간다. 그러던 와중 Openpose 예제를 찾아보다 놀랐다. OpenCV에서 tf의 모델을 가져와서 돌리는거다! 심지어 import tensorflow도 안하고!!! 이게 뭐여! 하고 보니 신세계였다. 아래 예제는 pytorch 모델을 onnx로 변형 후 opencv에서 읽어오는 예제이다. 모델을 .eval() 모드로 바꾼 후 예시 입력과 함께 onnx로 변형한다. 그 후 cv에서 cv2.dnn.readNet()을 이용하여 가져온다. 근데 이 때 caffe, TF, torch, Darknet, onnx 모두 가능하다!!! 하..
강화학습으로 StarCraft II 하기 - 1) PySC2 환경설정 DeepStar : 핸즈온 RL - 1회차 본 글은 싸이버스의 DeepStar 핸즈온 후 정리하는 블로그 이다. 강화학습을 이용하여 스타크래프트2를 학습시키는 것이 목적이다. 내용 * (스타2) StarCraft II Learning Environment 튜토리얼 (1) - 환경설정, 간단한 제어 예시 * (핸즈온 RL) - Chapter 1, What is Reinforcement Learning? - Chapter 2, OpenAI Gym 1. StarCraft II Learning Environment 튜토리얼 (1) - 환경설정, 간단한 제어 예시 김무성, 조남운님의 github을 보고 작성하였다. https://github.com/keep-steady/DeepStar/tree/master/sea..
Pytorch visualization #1. Visodom 사용법 파이토치를 이용하다가 실시간 visualization을 하기 위해여 visdom을 사용하였다. Tensorboad를 사용하다가 visdom을 써보니 편한듯 하지만 좀 어설퍼보인다는 생각이 자꾸 든다. 최근호님의 튜토리얼을 현재 버전에 맞게 수정하고 그림을 추가하였다. Visdom Tutorial 튜토리얼, 현재 버전에 맞게 변형 및 그림 추가 - 본 블로그 실습 코드 : https://github.com/keep-steady/etc_code/blob/master/visdom_tutorial.ipynb - 공식 사이트 : https://github.com/facebookresearch/visdom - 튜토리얼 : https://github.com/GunhoChoi/PyTorch-FastCampus/blob..