강화학습 기본과 PyTorch (추상목, 자유아카데미)

포스팅 목차

강화학습 기본과 PyTorch (추상목, 자유아카데미)

‘강화학습을 공부해 볼까?’

그러나 이 영역으로 들어가기가 쉽지 않다: (1) 기존 신경망 학습 구조와 완전히 다르고, (2) 매우 많은 강화학습 방법을 어떤 순서로 공부해야 하는지 알기 어렵고, (3) 강화학습을 개념부터 코딩까지 분명하게 이해할 수 있도록 안내해 주는 저서를 찾아보기 어렵기 때문이다.

이런 문제를 해결할 수 있는 안내서를 만드는 것이 본 저서의 목적이다: (1) 비지도 학습과 지도 학습에 없는 환경과 에이전트를 먼저 이해해야 한다. 이것이 강화학습의 첫걸음이다(1장). 여러 예제를 통해 그림만으로 환경과 에이전트를 이해하고 이를 수식으로 표현하는 연습이 되어야, 행동을 잘 선택해서 현재와 미래에 받을 보상의 총합을 최대로 만드는 과정을 이해할 수 있다. (2) 아래 표와 같이 환경을 알 때의 강화학습은 1~4장에서 다루고 모를 때는 5~11장에서 다룬다. 신경망 사용 여부를 기준으로 하면, 1~6장에서는 사용하지 않고 7~11장에서는 사용한다.

* 출처 : https://product.kyobobook.co.kr/detail/S000211970862

강화학습 기본과 PyTorch | 추상목 - 교보문고

강화학습 기본과 PyTorch |

product.kyobobook.co.kr

저작자표시 비영리 변경금지

강화학습 기본과 PyTorch (추상목, 자유아카데미)

강화학습 기본과 PyTorch (추상목, 자유아카데미)

댓글

티스토리툴바