DAMPER's blog

[Data Mining] 4 - K-means clustering 본문

AI | data mining

[Data Mining] 4 - K-means clustering

DAMPER 2022. 11. 1. 10:35
728x90

k-means Algorithm

유클리디안 공간/distance 를 가정.

k (cluster 수)를 뽑으면서 시작.

 

(1). 초기 centroid k개를 뽑는다.

(2). 각 점들을 가장 가까운 centroid를 포함하는 cluster에 할당한다.

(3). 각 cluster의 centroid를 다시 계산한다.

(4). (2), (3)을 centroid가 변경되지 않을 때까지 계속한다.

 

 

k는 어떻게 선정하는가?

k를 진행하면서 centroid까지의 평균 distance가 빠르게 덜어지는 구간에서 선택.

 

 

728x90