'A3C' 태그의 글 목록

728x90

A3C 1

Asynchronous Methods for Deep Reinforcement Learning (A3C 리뷰)

논문 소개 ‌ 링크 : https://arxiv.org/pdf/1602.01783.pdf‌ github : https://github.com/ikostrikov/pytorch-a3c ‌ Main Contributions‌ Experience replay 기반 RL 대신, 비동기 병렬 방식을 이용한 새로운 패러다임 제시 GPU 기반의 학습보다, 병렬 처리 기반 CPU 연산으로 학습 속도, 안정성 개선‌ 1. Intro 요약‌ Experience replay 기반의 RL은 메모리와 연산이 더 크고, off-policy여서 업데이트 과정도 필요 본 논문에서는 비동기 병렬 방식을 이용해 새로운 패러다임을 제시 프로세스에서 다양한 스펙트럼이 생기고, Q-Learning 과 같은 다양한 off-policy 알고리즘..

AI | ML/Reinforcement Learning 2021.06.10

공부, 그리고 기록

Unity ML-Agent, python flask, 파이썬 알고리즘, 테트리스 DQN, Windows, Brute-force, matplotlib, 테트리스 강화학습, efficientDet, Data Science, 브루트포스, C++, 강화학습 DQN, 딥러닝, 백준 알고리즘, ONNX, Python GIL, Python, 몬스테라 분갈이, 알고리즘,

Today :
Yesterday :

728x90

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

깜태

A3C 1

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역