KNN의 알고리즘의 개념은 모두 숙지되었다. 이제 아래 데이터베이스를 KNN알고리즘으로 코드를 작성해보자.
1.X, Y 데이터 분리
y = df['Purchased']
X = df.loc[ : , ['Age','EstimatedSalary']]
2. Feature Scaling
from sklearn.preprocessing import StandardScaler
scaler_X = StandardScaler()
X = scaler_X.fit_transform(X)
3.Dataset을 Training 용과 Test용 나누기
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test =train_test_split(X,y, test_size=0.25 ,random_state=1)
4.KNN 알고리즘 사용하기
#분류기를 생성해준다.
classifier = KNeighborsClassifier(n_neighbors= 3)
#학습 데이터를 이용하여 모델을 학습한다.
classifier.fit(X_train,y_train)
# 테스트 데이터에 대해서 예측 수행한다.
y_pred = classifier.predict(X_test)
5. confusion_matrix, accuracy_score 확인
'Machine Learning' 카테고리의 다른 글
[Machine Learning]머신러닝의 Decision Tree 알고리즘 (0) | 2024.04.16 |
---|---|
[Machine Learning]머신러닝의 Support Vector Machine(SVM)알고리즘 (0) | 2024.04.15 |
[Machine Learning]머신러닝의Confusion Matrix 및accuracy_score 사용 (0) | 2024.04.15 |
[Machine Learning]머신러닝의 로지스틱 회귀(Logistic Regression) (0) | 2024.04.15 |
[Machine Learing]머신러닝의 데이터 전처리과정(3)선형회(LinearRegression) (0) | 2024.04.14 |