728x90
k-means Algorithm
유클리디안 공간/distance 를 가정.
k (cluster 수)를 뽑으면서 시작.
(1). 초기 centroid k개를 뽑는다.
(2). 각 점들을 가장 가까운 centroid를 포함하는 cluster에 할당한다.
(3). 각 cluster의 centroid를 다시 계산한다.
(4). (2), (3)을 centroid가 변경되지 않을 때까지 계속한다.
k는 어떻게 선정하는가?
k를 진행하면서 centroid까지의 평균 distance가 빠르게 덜어지는 구간에서 선택.
728x90
'AI | data mining' 카테고리의 다른 글
| [Data Mining] 4 - Clustering (0) | 2022.11.01 |
|---|---|
| [Data Mining] 3 - Finding Similar Items : Locality Sensitive Hashing (0) | 2022.11.01 |
| [Data Mining] 2 - Frequent Items : A-Priori algorithm (0) | 2022.10.31 |
| [Data Mining] 2 - Frequent Itemset (0) | 2022.10.31 |