본문 바로가기

AI | data mining

[Data Mining] 4 - K-means clustering

728x90

k-means Algorithm

유클리디안 공간/distance 를 가정.

k (cluster 수)를 뽑으면서 시작.

 

(1). 초기 centroid k개를 뽑는다.

(2). 각 점들을 가장 가까운 centroid를 포함하는 cluster에 할당한다.

(3). 각 cluster의 centroid를 다시 계산한다.

(4). (2), (3)을 centroid가 변경되지 않을 때까지 계속한다.

 

 

k는 어떻게 선정하는가?

k를 진행하면서 centroid까지의 평균 distance가 빠르게 덜어지는 구간에서 선택.

 

 

728x90