논문 : https://openaccess.thecvf.com/content/CVPR2021/papers/Hong_Reinforced_Attention_for_Few-Shot_Learning_and_Beyond_CVPR_2021_paper.pdf Abstract Policy Gradient 알고리즘을 이용한 RL 기반의 attention agent로 Backbone 네트워크 제안 학습된 적 없는 데이터에도 학습이 가능한 범용적인 reward function 설계 Introduction 딥러닝 알고리즘이 데이터에 의존적임에 따라 라벨링의 중요성이 언급되지만, 데이터가 클수록 준비해야하는 양도 많다보니 제약이 많다 → few-shot learning 연구의 시작점 언급 few-shot learning 접근법..