Python to AI

Machine learning Vol.2

최 수빈 2024. 12. 17. 23:21

이중 분류와 다중 분류

1. 이중 분류 (Binary Classification)

두 개의 클래스로 분류하는 문제

확률값에 따라 구분됨

  • 핵심 원리
    • 확률이 0.5 이상: 특정 클래스 (예: 긍정)
    • 확률이 0.5 미만: 다른 클래스 (예: 부정)
  • 이중 분류 활용 사례
    • 스팸 분류: 스팸인지 아닌지
    • 의료 진단: 당뇨병인지 아닌지
    • 대출 평가: 대출을 해줄까 말까

2. 다중 분류 (Multiclass Classification)

세 개 이상의 클래스로 분류하는 문제

  • 활용 사례
    • 메일 분류: 스팸, 광고, 일반, 업무
    • 교통 체증 분류: 원활, 지체, 정체
    • 뉴스 카테고리 분류: 경제, 정치, 에세이
    • 음악 장르 분류: 재즈, 힙합, 인디
  • 다중 분류 원리
    • 입력 데이터가 여러 클래스 중 하나에 속하도록 예측하는 문제
    • 클래스별 확률의 합이 1이 되도록 조정해야 하며, 이를 위해 Softmax 함수를 사용
      예시:
      • 고양이일 확률: 0.7
      • 강아지일 확률: 0.2
      • 공룡일 확률: 0.1

다중분류는 이중 분류를 확장한 형태로 여러 개의 클래스(예: 고양이, 강아지, 공룡)을 다룸

Softmax함수 덕분에 각 클래스의 확률을 0과 1사이로 조정하고, 모든 클래스의 확률 합이 1이 됨

 

Softmax 함수의 수식

주어진 입력 값 yi를 클래스 i에 대한 점수(score)라고 할 때, Softmax 정의:

 

softmax(yi) = exp(yi) / ∑exp(yj)

 

 

  •  각 클래스에 대한 점수 (logit)
  • exp⁡(yi) 점수를 지수화한 값
  • ∑exp⁡(yj) 모든 클래스 점수의 지수화된 합 (정규화)

 


3. 머신러닝의 종류

3-1. 지도 학습 (Supervised Learning)

입력과 정답(라벨)이 있는 데이터를 학습

  • MNIST 데이터셋
    • 손글씨 숫자 이미지 데이터셋
    • 28x28 = 784 픽셀
    • 0부터 9까지 숫자의 흑백 이미지
    • 주로 머신러닝 및 딥러닝 모델 학습과 평가에 사용

3-2. 비지도 학습 (Unsupervised Learning)

정답(라벨)이 없는 데이터를 사용해 스스로 패턴을 학습

  • 주요 기법: 군집화(Clustering)
    • 활용 사례: 고객 분류, 상품 추천

3-3. 강화 학습 (Reinforcement Learning)

행동(액션)에 대한 보상을 통해 학습

  • 핵심 개념: 보상 학습 (Reward-Based Learning)
  • 대립적 강화학습 (Adversarial RL)
    • 예시: 생성자와 판별자
      • 생성자: 이미지를 생성
      • 판별자: 이미지가 실제인지 가짜인지 판별
  • 활용 사례
    • 자율 주행
    • 게임 AI

'Python to AI' 카테고리의 다른 글

AI/ML/DL  (1) 2024.12.24
Python - Pandas(데이터 프레임 구조 재조정)  (3) 2024.12.18
Python - Pandas(다차원데이터관리 : MultiIndex)  (4) 2024.12.17
Machine learning  (6) 2024.12.16
Python - 객체 탐색과 속성 관리  (4) 2024.12.15