군집화모델 2

비지도학습 : 군집화 모델 - DBSCAN

DBSCAN(Density-Based Spatial Clustering of Applications with Noise) 밀도 기반 군집화 알고리즘데이터 밀도가 높은 영역을 군집으로 간주하고, 밀도가 낮은 영역을 노이즈로 처리 비구형 군집 탐지 가능 : 원형이 아닌 군집도 효과적으로 탐색 가능노이즈 처리 가능 : 밀도가 낮은 데이터 포인트를 자동으로 노이즈로 분류군집 수 자동 결정 : 군집 개수를 미리 설정할 필요 없음 주요 매개변수eps : 두 데이터 포인트가 같은 군집에 속하기 위한 최대 거리min_samples : 한 군집을 형성하기 위해 필요한 최소 데이터 포인트 수 작동원리임의의 데이터 포인트 선택선택한 데이터 포인트의 eps 반경 내에 있는 모든 데이터 포인트를 찾음eps 반경 내 데이터 수가..

⊢MachineLearning 2025.03.17

비지도학습 : 군집화 모델 - 계층적 군집화

계층적 군집화(Hierarchical Clustering) 데이터 포인트들을 계층 구조로 그룹화하는 군집화 방법 데이터 포인트를 점진적으로 병합하거나 분할하여 군집을 형성계층적 구조를 시각화할 수 있는 덴드로그램(Dendrogram) 생성 계층적 군집화의 방식 병합 군집화(Agglomerative Clustering)각 데이터 포인트를 개별 군집으로 시작가장 가까운 군집을 반복적으로 병합분할 군집화(Divisive Clusterting)모든 데이터 포인트를 하나의 군집으로 시작반복적으로 가장 멀리 떨어진 군집을 분할 계층적 군집화의 작동 원리 거리 행렬 계산각 데이터 포인트 간의 거리를 계산하여 거리 행렬을 생성대표적인 거리 계산 방법 : 유클리드 거리(Euclidean distance)군집 병합/분할병..

⊢MachineLearning 2025.03.17
728x90