[Data Mining] 4 - K-means clustering

728x90

k-means Algorithm

유클리디안 공간/distance 를 가정.

k (cluster 수)를 뽑으면서 시작.

(1). 초기 centroid k개를 뽑는다.

(2). 각 점들을 가장 가까운 centroid를 포함하는 cluster에 할당한다.

(3). 각 cluster의 centroid를 다시 계산한다.

(4). (2), (3)을 centroid가 변경되지 않을 때까지 계속한다.

k는 어떻게 선정하는가?

k를 진행하면서 centroid까지의 평균 distance가 빠르게 덜어지는 구간에서 선택.

728x90

[Data Mining] 4 - Clustering (0)	2022.11.01
[Data Mining] 3 - Finding Similar Items : Locality Sensitive Hashing (0)	2022.11.01
[Data Mining] 2 - Frequent Items : A-Priori algorithm (0)	2022.10.31
[Data Mining] 2 - Frequent Itemset (0)	2022.10.31

DAMPER's 낙서장