프로그래밍 공부
작성일
2022. 11. 18. 01:17
작성자
WDmil
728x90

K-means 클러스터링

1. 군집에 센터벡터를 랜덤하게 만듬

 

군집에 데이터가 얼마나 가까운지 테스트

minkowski 거리

두 점 간의 거리척도

p=2 면 유클리디언 거리 2 

p=1이면 맨하탄 거리 1

 

유클리디언 거리 

멘하탄 거리 내적의 결과는 스칼라로 나오게 된다.

 

코사인 유사도

문서 검색 응용에서 주로 사용한다.

문서 내의 각 단어에 가중치를 넣어서 각 단어간 코사인 유사도를 계산하여

데이터간의 거리를 확인하고 측정한다.

 

k-meas

 

이미지 또한 분할이 가능하다.

군집화 결과

 

특징 추출 기법

728x90