본문 바로가기

Unsupervised

(3)
[Machine Learning]머신러닝Unsupervised의Hierarchical Clustering Hierachical Clustering 계층적 군집화 -계층적 트리 모형을 이용해 개별 개체들을 순차적, 계층적으로 유사한 개체 내지 그룹과 통합하여 군집화를 수행하는 알고리즘 - K-means Clustering과 달리 군집 수를 사전에 정하지 않아도 학습을 수행할 수 있다. - Dendrogram 이용 Dendrogram 덴드로그램 - 개체들이 결합되는 순서를 나타내는 트리형태의 구조 - 적절한 수준에서 트리를 자르면 전체 데이터를 몇개 군집으로 나눌 수 있게 된다. 1.na가 있는지 확인 df.isna().sum() 했을때 모두 0이 나와 na 없음 2.X데이터 분리 Unsupervised이므로 X데이터만 분리한다. X = df.iloc[ : , 1: ] 3.Label Encoding from s..
[Machine Learning]머신러닝Unsupervised의K-Means Clustering K-Means Clustering K-Means Clustering은 비지도 학습 알고리즘으로, 데이터를 그룹화(클러스터링)하는데 사용된다. K-Means Clustering 순서 데이터 준비: 우리는 각 데이터 포인트의 위치를 나타내는 좌표를 갖고 있다.. K 설정: K-Means Clustering을 시작하기 전에 클러스터의 수 K를 정해야 한다. 여기서는 우리가 2개의 그룹으로 나누고 싶다고 가정한다. 중심 초기화: 무작위로 두 개의 점(중심)을 선택하여 각각의 그룹의 중심점으로 설정한다. 할당 단계: 각 데이터 포인트를 가장 가까운 중심에 할당한다. 이를 위해 일반적으로 유클리드 거리 등의 거리 측정 방법을 사용한다. 갱신 단계: 각 그룹의 중심을 해당 그룹에 속한 데이터 포인트들의 평균으로 업데..
[Machine Learning]머신러닝의 정의 및 사용되는 것(Supervised , Unsupervised) 머신러닝으로 할 수 있는 것 편지봉투에 손으로 쓴 우편번호 숫자 자동 판별 의료 영상 이미지에 기반한, 종양 판단 의심되는 신용카드 거래 감지 블로그 글의 주제 분류 고객들을 취향이 비슷한 그룹으로 묶기 여기에서 Supervised(지도학습)과 Unsupervised(비지도학습)은 머신러닝에서 사용되는 두 가지 주요한 학습 방법이다 Supervised Learning(지도학습): 지도학습은 입력 데이터와 정답(label 또는 target)을 함께 사용하여 모델을 학습시키는 방법이다. 모델은 입력 데이터와 정답(label) 간의 관계를 학습하여 새로운 데이터에 대한 예측을 수행할 수 있다. 주로 분류(Classification)와 회귀(Regression) 문제에 사용된다. 일반적인 알고리즘으로는 선형 회..