반응형 박유성 교수1 Stable Baselines를 이용한 강화학습(박유성 교수, 자유아카데미) Stable Baselines를 이용한 강화학습(박유성 교수, 자유아카데미) * 머리말 저자는 코딩에 능숙하지 못하지만 파이썬 라이브러리 sklearn 덕분에 큰 어려움 없이 머신러닝을 이해하고 실습할 수 있었으며 Keras나 Pytorch라는 high level 프로그래밍 언어 덕분에 딥러닝을 이해하고 활용할 수 있었다. 강화학습(reinforcement learning)은 인공지능에서 가장 코딩이 복잡하고 난해하여 배우기 어려우나 응용분야가 게임, 금융, 자율자동차, 자율주차, 로봇 등 무궁무진하며, 발전 가능성이 매우 높은 분야이다. 딥러닝과 통계적 추정 방법을 근간으로 하는 강화학습은 40년 이상 통계학만 연구해온 저자에게 정적인 통계학을 동적인 통계학으로 응용할 수 있겠다는 설렘과 호기심으로 다.. 2021. 11. 1. 이전 1 다음 반응형