이 자료는 혁펜하임 유튜브를 바탕으로 학습하여 정리한 내용입니다. 문제가 있을시 댓글이나 이메일로 연락바랍니다! 감사합니다 https://www.youtube.com/channel/UCcbPAIfCa4q0x7x8yFXmBag/featured 강화학습 1~2강 강화학습의 예)Reinforcement learning의 예: 알파고, 알파스타, cart-pole goal=maximize Reward하기 위한 액션들을 잘 찾는 것 reinforcement learning-맛집 찾기를 예로 들어 설명 Q-learning 알고리즘 greedy action을 사용한다. greedy action이란 목표로 최소한으로 이동하고자 할 때 이동을 하면서 점수를 매겨서 점수가 가장 큰 쪽으로 움직이는 것을 greedy act..