학문적 정의와 알고리즘 분류는 기계학습 참조 이 노트는 실전 관점의 학습 유형 정리
지도학습 (Supervised Learning)
정답이 있는 데이터를 활용해 모델을 학습시키는 방법
분류 (Classification)
- 주어진 데이터를 정해진 카테고리(라벨)에 따라 분류하는 문제
- 참/거짓의
이진 분류또는 사과/바나나/포도 같은다중 분류 - 대표 모델: CNN, Decision Tree, SVM, Naive Bayes, kNN
회귀 (Regression)
- 데이터의 특징(Feature)을 기준으로 연속된 값을 예측하는 문제
- 패턴이나 트렌드, 경향을 예측할 때 사용
- 예시: 아파트 평수/지역 기반 집값 예측
- 대표 모델: Linear Regression, Ridge, Lasso, RNN
비지도학습 (Unsupervised Learning)
정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하여 패턴을 찾는 방법
- 클러스터링 (Clustering)
- Dimensionality Reduction, Hidden Markov Model
- GAN (Generative Adversarial Network)
- 생성자(Generator)가 판별자(Discriminator)를 속이도록 훈련되는 방식으로 비지도 학습 수행
- 제로섬 게임(zero-sum game): 생성자는 목적 함수를 최소화, 판별자는 최대화
강화학습 (Reinforcement Learning)
행동 심리학에서 나온 이론으로, 자신이 한 행동에 대해 보상(reward)을 받으며 학습하는 방법
- 에이전트 (Agent)
- 환경 (Environment)
- 상태 (State)
- 행동 (Action)
- 보상 (Reward)
대표 알고리즘
| 분류 | 종류 | 알고리즘 |
|---|---|---|
| Supervised | Classification | kNN, Naive Bayes, SVM, Decision Tree |
| Regression | Linear Regression, Locally Weighted Linear, Ridge, Lasso | |
| Unsupervised | K-Means, Density Estimation, EM, DBSCAN | |
| Reinforcement | DQN, A3C |
Feature Engineering
- Feature는 Label, Class, Target, Response, Dependent variable 등으로도 불림
- 딥러닝 이전: Feature Engineer가 직접 Raw 데이터에서 적절한 피처를 추출
- 딥러닝 이후: Raw 데이터를 모델에 입력하면 모델이 자동으로 feature를 학습
알파고 (AlphaGo)
- 강화학습 + 딥러닝을 결합한 바둑 AI
- 바둑 모든 경우의 수
관련 노트
- 기계학습 - 학문적 정의 및 알고리즘 분류
- 신경망 - ANN/DNN/CNN/RNN 구조
- NLP - 자연어 처리
- Fine Tuning - 사전학습 모델 파라미터 조정
- KILT - 지식 집약적 언어 작업 벤치마크