Introduction to Reinforcement Learning and Key Algorithms
오늘날 인공지능은 다양한 분야에서 주요한 역할을 하고 있다. 강화학습은 인공지능의 여러 패러다임 중 하나로서 에이전트로 하여금 환경과 상호작용을 하고, 상호작용으로부터 보상을 받음으로써 특정한 태스크를 학습하도록 하는 분야이다. 특히나 강화학습 이론을 바탕으로 구현된 AlphaGo의 성공은 바둑과 같이 복잡한 태스크에 대해서도 인공지능이 학습하고 인간의 능력을 상회할 수 있음을 보여주었다. 앞으로 강화학습은 순차적이고 복잡한 문제를 해결해줄 것이라고 기대되고 있다. 본 기술문서는 강화학습의 기본 개념과 주요 알고리즘을 소개한다. 또한, 주요 알고리즘을 Python으로 구현한 코드를 보인다.
보고서작성: 고려대학교 정보보호대학원 해킹대응기술연구실 (지도교수 : 김휘강 교수)
DOWNLOAD
DOWNLOAD
Korean Version (국문): Download
AUTHOR
AUTHOR
박상범, 이재성, 사공채연, 유정도, 송민근, 최재웅, 김휘강
ACKNOWLEDGEMENT
ACKNOWLEDGEMENT
This work was supported by Institute of Information & Communications Technology Planning & Evaluation (IITP) grant funded by the Korea government (MSIT) (No. 2021-0-00624, Development of Intelligence Cyber Attack and Defense Analysis Framework for Increasing Security Level of C-ITS)
HISTORY
HISTORY
Written on 2024-11-15