'stable baselines3 CNN' 태그의 글 목록

728x90

stable baselines3 CNN 1

stable-baselines3에서는 PPO, A2C, DDPG 등의 강화학습 모델들이 기본적으로 주어진다. 강화학습모델 안에서 내부 모델을 cnn으로 짤지 MLPpolicy를 쓸지 다양한 선택지가 주어지는데 보통은 mlp를 많이 쓰기도 하지만 cnn으로 진행하는 경우도 있다. 기본 제공 Network Stable-baselines3에서는 기본적으로 CnnPolicy, MlpPolicy, MultiInputPolicy를 제공하는데 Multi Input은 안써봐서 생략하겠다. CNN CNN에서는 convolution 시, kernel_size, stride, padding 등의 파라미터 설정값과 네트워크의 레이어에 따라 추출된 특징이 언제든 변할 수 있다. 아래는 stable-baselines3에서 기본적..

AI | ML/Reinforcement Learning 2021.08.02

공부, 그리고 기록

ONNX, efficientDet, 딥러닝, 파이썬 알고리즘, python flask, Brute-force, matplotlib, 테트리스 강화학습, C++, Windows, 백준 알고리즘, Python GIL, Unity ML-Agent, 몬스테라 분갈이, Python, 알고리즘, Data Science, 강화학습 DQN, 브루트포스, 테트리스 DQN,

Today :
Yesterday :

728x90

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

깜태

stable baselines3 CNN 1

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역