한국기술교육대학교 LINK 연구실

심층 강화학습 인 액션, 알렉스 짜이, 브랜던 브라운 지음 | 류광 옮김 | 제이펍 | 2020년 11월 17일 출간, 국내서: , 원서:

발표자: 지창훈, 유승범, 오차영, 길상현, 이승훈, 최요한

멘토: 김주봉, 최호빈, 황규영, 허주성

12월 29일 (화): CHAPTER 1 강화학습이란? – 지창훈 (페이지수 : 22)
1월 5일 (화): CHAPTER 2 강화학습 문제의 모형화: 마르코프 결정 과정 – 유승범 (페이지수 : 36)
1월 12일 (화): CHAPTER 3 가장 나은 동작의 선택: 심층 Q 신경망(DQN) – 오차영 (페이지수 : 24, 3.1~3.2)
1월 19일 (화): CHAPTER 3 가장 나은 동작의 선택: 심층 Q 신경망(DQN) – 길상현 (페이지수 : 18, 3.3~3.5)
1월 26일 (화): CHAPTER 4 정책 기울기 방법 – 이승훈 (페이지수 : 24)
2월 2일 (화): CHAPTER 5 좀 더 어려운 문제 풀기: 행위자-비평자 모형 – 최요한 (페이지수 : 32)
2월 4일 (목): CHAPTER 6 또 다른 최적화 방법 – 지창훈 (페이지수 : 30)
2월 9일 (화): CHAPTER 7 모든 가능성의 탐색: 분포 심층 Q 신경망 – 유승범 (페이지수 : 28, 7.1~7.4)
2월 16일 (화): CHAPTER 7 모든 가능성의 탐색: 분포 심층 Q 신경망 – 오차영 (페이지수 : 20, 7.5~7.7)
2월 18일 (목): CHAPTER 8 호기심 주도 탐험 – 길상현 (페이지수 : 38)
2월 23일 (화): CHAPTER 9 다중 에이전트 강화학습 – 이승훈 (페이지수 : 21, 9.1~9.3)
2월 25일 (목): CHAPTER 9 다중 에이전트 강화학습 – 최요한 (페이지수 : 27, 9.4~9.5)
3월 2일 (화): CHAPTER 10 해석 가능한 강화학습: 주의 모형과 관계 모형 – 자창훈 (페이지수 : 31, 10.1~10.3)
3월 4일 (목): CHAPTER 10 해석 가능한 강화학습: 주의 모형과 관계 모형 – 유승범 (페이지수 : 23, 10.4~10.6)