클러스터링 입문 (K-평균)
클러스터링
은 비지도 학습
방법으로, 목표는 레이블 없이 유사한 데이터 포인트를 군집으로 묶는 것입니다.
가장 널리 쓰이는 알고리즘 중 하나가 K-평균(K-Means)
입니다.
K-평균은 어떻게 동작하나요?
다음은 K-평균
의 단계입니다.
k 선택
: 클러스터(군집) 개수를 정합니다.초기화
: k개의 클러스터 중심을 무작위로 설정합니다.포인트 할당
: 각 포인트를 가장 가까운 중심에 할당합니다.중심 업데이트
: 각 클러스터에 속한 포인트들의 평균으로 중심을 갱신합니다.반복
: 클러스터 할당이 더 이상 바뀌지 않을 때까지 3-4단계를 반복합니다.
K-평균은 같은 클러스터 내의 포인트들과 그 클러스터 중심 사이의 거리를 최소화하려고 합니다.