Machine Learning

AI

학문적 정의와 알고리즘 분류는 기계학습 참조 이 노트는 실전 관점의 학습 유형 정리

지도학습 (Supervised Learning)

정답이 있는 데이터를 활용해 모델을 학습시키는 방법

분류 (Classification)

  • 주어진 데이터를 정해진 카테고리(라벨)에 따라 분류하는 문제
  • 참/거짓의 이진 분류 또는 사과/바나나/포도 같은 다중 분류
  • 대표 모델: CNN, Decision Tree, SVM, Naive Bayes, kNN

회귀 (Regression)

  • 데이터의 특징(Feature)을 기준으로 연속된 값을 예측하는 문제
  • 패턴이나 트렌드, 경향을 예측할 때 사용
  • 예시: 아파트 평수/지역 기반 집값 예측
  • 대표 모델: Linear Regression, Ridge, Lasso, RNN

비지도학습 (Unsupervised Learning)

정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하여 패턴을 찾는 방법

  • 클러스터링 (Clustering)
  • Dimensionality Reduction, Hidden Markov Model
  • GAN (Generative Adversarial Network)
    • 생성자(Generator)가 판별자(Discriminator)를 속이도록 훈련되는 방식으로 비지도 학습 수행
    • 제로섬 게임(zero-sum game): 생성자는 목적 함수를 최소화, 판별자는 최대화

강화학습 (Reinforcement Learning)

행동 심리학에서 나온 이론으로, 자신이 한 행동에 대해 보상(reward)을 받으며 학습하는 방법

  • 에이전트 (Agent)
  • 환경 (Environment)
  • 상태 (State)
  • 행동 (Action)
  • 보상 (Reward)

대표 알고리즘

분류 종류 알고리즘
Supervised Classification kNN, Naive Bayes, SVM, Decision Tree
Regression Linear Regression, Locally Weighted Linear, Ridge, Lasso
Unsupervised K-Means, Density Estimation, EM, DBSCAN
Reinforcement DQN, A3C

Feature Engineering

  • Feature는 Label, Class, Target, Response, Dependent variable 등으로도 불림
  • 딥러닝 이전: Feature Engineer가 직접 Raw 데이터에서 적절한 피처를 추출
  • 딥러닝 이후: Raw 데이터를 모델에 입력하면 모델이 자동으로 feature를 학습

알파고 (AlphaGo)

관련 노트

  • 기계학습 - 학문적 정의 및 알고리즘 분류
  • 신경망 - ANN/DNN/CNN/RNN 구조
  • NLP - 자연어 처리
  • Fine Tuning - 사전학습 모델 파라미터 조정
  • KILT - 지식 집약적 언어 작업 벤치마크

참고