이중 분류와 다중 분류
1. 이중 분류 (Binary Classification)
두 개의 클래스로 분류하는 문제
확률값에 따라 구분됨
- 핵심 원리
- 확률이 0.5 이상: 특정 클래스 (예: 긍정)
- 확률이 0.5 미만: 다른 클래스 (예: 부정)
- 이중 분류 활용 사례
- 스팸 분류: 스팸인지 아닌지
- 의료 진단: 당뇨병인지 아닌지
- 대출 평가: 대출을 해줄까 말까
2. 다중 분류 (Multiclass Classification)
세 개 이상의 클래스로 분류하는 문제
- 활용 사례
- 메일 분류: 스팸, 광고, 일반, 업무
- 교통 체증 분류: 원활, 지체, 정체
- 뉴스 카테고리 분류: 경제, 정치, 에세이
- 음악 장르 분류: 재즈, 힙합, 인디
- 다중 분류 원리
- 입력 데이터가 여러 클래스 중 하나에 속하도록 예측하는 문제
- 클래스별 확률의 합이 1이 되도록 조정해야 하며, 이를 위해 Softmax 함수를 사용
예시:- 고양이일 확률: 0.7
- 강아지일 확률: 0.2
- 공룡일 확률: 0.1
다중분류는 이중 분류를 확장한 형태로 여러 개의 클래스(예: 고양이, 강아지, 공룡)을 다룸
Softmax함수 덕분에 각 클래스의 확률을 0과 1사이로 조정하고, 모든 클래스의 확률 합이 1이 됨
Softmax 함수의 수식
주어진 입력 값 yi를 클래스 i에 대한 점수(score)라고 할 때, Softmax 정의:
softmax(yi) = exp(yi) / ∑exp(yj)
- 각 클래스에 대한 점수 (logit)
- exp(yi) 점수를 지수화한 값
- ∑exp(yj) 모든 클래스 점수의 지수화된 합 (정규화)
3. 머신러닝의 종류
3-1. 지도 학습 (Supervised Learning)
입력과 정답(라벨)이 있는 데이터를 학습
- MNIST 데이터셋
- 손글씨 숫자 이미지 데이터셋
- 28x28 = 784 픽셀
- 0부터 9까지 숫자의 흑백 이미지
- 주로 머신러닝 및 딥러닝 모델 학습과 평가에 사용
3-2. 비지도 학습 (Unsupervised Learning)
정답(라벨)이 없는 데이터를 사용해 스스로 패턴을 학습
- 주요 기법: 군집화(Clustering)
- 활용 사례: 고객 분류, 상품 추천
3-3. 강화 학습 (Reinforcement Learning)
행동(액션)에 대한 보상을 통해 학습
- 핵심 개념: 보상 학습 (Reward-Based Learning)
- 대립적 강화학습 (Adversarial RL)
- 예시: 생성자와 판별자
- 생성자: 이미지를 생성
- 판별자: 이미지가 실제인지 가짜인지 판별
- 예시: 생성자와 판별자
- 활용 사례
- 자율 주행
- 게임 AI
'Python to AI' 카테고리의 다른 글
AI/ML/DL (1) | 2024.12.24 |
---|---|
Python - Pandas(데이터 프레임 구조 재조정) (3) | 2024.12.18 |
Python - Pandas(다차원데이터관리 : MultiIndex) (4) | 2024.12.17 |
Machine learning (6) | 2024.12.16 |
Python - 객체 탐색과 속성 관리 (4) | 2024.12.15 |