본문 바로가기

Machine Learning

(7)
[Machine Learning]머신러닝Unsupervised의K-Means Clustering K-Means Clustering K-Means Clustering은 비지도 학습 알고리즘으로, 데이터를 그룹화(클러스터링)하는데 사용된다. K-Means Clustering 순서 데이터 준비: 우리는 각 데이터 포인트의 위치를 나타내는 좌표를 갖고 있다.. K 설정: K-Means Clustering을 시작하기 전에 클러스터의 수 K를 정해야 한다. 여기서는 우리가 2개의 그룹으로 나누고 싶다고 가정한다. 중심 초기화: 무작위로 두 개의 점(중심)을 선택하여 각각의 그룹의 중심점으로 설정한다. 할당 단계: 각 데이터 포인트를 가장 가까운 중심에 할당한다. 이를 위해 일반적으로 유클리드 거리 등의 거리 측정 방법을 사용한다. 갱신 단계: 각 그룹의 중심을 해당 그룹에 속한 데이터 포인트들의 평균으로 업데..
[Machine Learning]머신러닝의 Decision Tree 알고리즘 Decision Tree Decision Tree는 데이터를 분류하거나 예측하는 모델 중 하나 Decision Tree 알고리즘을 이용하여 코드를 작성해보자 1.X, Y 데이터 분리 y = df['Purchased'] X = df.loc[ : , ['Age','EstimatedSalary']] 2. Feature Scaling from sklearn.preprocessing import StandardScaler scaler_X = StandardScaler() X = scaler_X.fit_transform(X) 3.Dataset을 Training 용과 Test용 나누기 from sklearn.model_selection import train_test_split X_train, X_test, y_tr..
[Machine Learning]머신러닝의 Support Vector Machine(SVM)알고리즘 SVM이란? Support Vector Machine(SVM)은 데이터를 분류하기 위한 지도학습 알고리즘 중 하나이다. 주어진 데이터를 가장 잘 나누는 초평면(hyperplane)을 찾는 것이 SVM의 목표이다. 이를 통해 데이터를 분류하거나 회귀하는 데 사용될 수 있다. 1. SVC의 작동 원리 1.X, Y 데이터 분리 y = df['Purchased'] X = df.loc[ : , ['Age','EstimatedSalary']] 2. Feature Scaling from sklearn.preprocessing import StandardScaler scaler_X = StandardScaler() X = scaler_X.fit_transform(X) 3.Dataset을 Training 용과 Test용..
[Machine Learning]머신러닝의 KNN 알고리즘(K-Nearest Neighbor) KNN의 알고리즘의 개념은 모두 숙지되었다. 이제 아래 데이터베이스를 KNN알고리즘으로 코드를 작성해보자. 1.X, Y 데이터 분리 y = df['Purchased'] X = df.loc[ : , ['Age','EstimatedSalary']] 2. Feature Scaling from sklearn.preprocessing import StandardScaler scaler_X = StandardScaler() X = scaler_X.fit_transform(X) 3.Dataset을 Training 용과 Test용 나누기 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test =train_test_spli..
[Machine Learning]머신러닝의Confusion Matrix 및accuracy_score 사용 Confusion Matrix 실제 Negative (음성) 클래스를 예측한 Negative (음성) 클래스와 Positive (양성) 클래스로 분류한 경우: True Negative (TN) 실제 Negative (음성) 클래스를 예측한 Positive (양성) 클래스로 잘못 분류한 경우: False Positive (FP) 실제 Positive (양성) 클래스를 예측한 Positive (양성) 클래스와 Negative (음성) 클래스로 분류한 경우: True Positive (TP) 실제 Positive (양성) 클래스를 예측한 Negative (음성) 클래스로 잘못 분류한 경우: False Negative (FN) Confusion Matrix를 보면 모델이 어떤 클래스를 얼마나 정확하게 분류했는지..
[Machine Learning]머신러닝의 로지스틱 회귀(Logistic Regression) #X와 y를 분리한다 y = df['Purchased'] => 물건을 구매할지 안할지의 정보를 y에 저장 X= df.iloc[ :, 2:3+1 ] => 나머지 데이터를 X에 저장한다 # 로지스틱 리그레션은, 피쳐 스케일링을 하자!! 정규화 OR 표준화를 해줌으로써 피쳐 스케일링을 해주도록 한다. 그다음 Test용과 Traing 용을 따로 만들어 주어 변수에 저장해준다 LogisticRegression은 위에 과정대로 입력을 받아서 해당 데이터가 어느 클래스에 속할 확률을 예측해주는 방법이다
[Machine Learning]머신러닝의 정의 및 사용되는 것(Supervised , Unsupervised) 머신러닝으로 할 수 있는 것 편지봉투에 손으로 쓴 우편번호 숫자 자동 판별 의료 영상 이미지에 기반한, 종양 판단 의심되는 신용카드 거래 감지 블로그 글의 주제 분류 고객들을 취향이 비슷한 그룹으로 묶기 여기에서 Supervised(지도학습)과 Unsupervised(비지도학습)은 머신러닝에서 사용되는 두 가지 주요한 학습 방법이다 Supervised Learning(지도학습): 지도학습은 입력 데이터와 정답(label 또는 target)을 함께 사용하여 모델을 학습시키는 방법이다. 모델은 입력 데이터와 정답(label) 간의 관계를 학습하여 새로운 데이터에 대한 예측을 수행할 수 있다. 주로 분류(Classification)와 회귀(Regression) 문제에 사용된다. 일반적인 알고리즘으로는 선형 회..