728x90

AI | ML/Reinforcement Learning 13

[RL] 강화학습 모델 라이브러리 stable-baselines3 사용해보기

링크 : https://github.com/DLR-RM/stable-baselines3 DLR-RM/stable-baselines3 PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms. - DLR-RM/stable-baselines3 github.com 소개 강화학습을 학습시키려고 하면 모델들마다 사용법이 각각 달라서 많은 에러를 겪곤 한다. 하지만, stable-baselines3 라이브러리를 이용하면 아래의 장점이 생긴다. 1. 다양하게 구현된 모델들을 사용할 수 있고, 2. 경우에 따라 multi-processing 까지 지원된다. 일일이 모델마다 구현할 필요가 없어진다는 의..

[gym] NotImplementedError 에러 해결방법

더보기 File "C:\Users\tw\anaconda3\lib\site-packages\gym\core.py", line 264, in reset observation = self.env.reset(**kwargs) File "C:\Users\tw\anaconda3\lib\site-packages\gym\core.py", line 265, in reset return self.observation(observation) File "C:\Users\tw\anaconda3\lib\site-packages\gym\core.py", line 272, in observation raise NotImplementedError NotImplementedError 에러원인 : gym 버전이 맞지 않아서 생기는 오류 ..

Asynchronous Methods for Deep Reinforcement Learning (A3C 리뷰)

논문 소개 ‌ 링크 : https://arxiv.org/pdf/1602.01783.pdf‌ github : https://github.com/ikostrikov/pytorch-a3c ‌ Main Contributions‌ Experience replay 기반 RL 대신, 비동기 병렬 방식을 이용한 새로운 패러다임 제시 GPU 기반의 학습보다, 병렬 처리 기반 CPU 연산으로 학습 속도, 안정성 개선‌ 1. Intro 요약‌ Experience replay 기반의 RL은 메모리와 연산이 더 크고, off-policy여서 업데이트 과정도 필요 본 논문에서는 비동기 병렬 방식을 이용해 새로운 패러다임을 제시 프로세스에서 다양한 스펙트럼이 생기고, Q-Learning 과 같은 다양한 off-policy 알고리즘..

728x90