본문 바로가기

Machine Learning

[Machine Learning]머신러닝의 KNN 알고리즘(K-Nearest Neighbor)

KNN의 알고리즘의 개념은 모두 숙지되었다. 이제 아래 데이터베이스를 KNN알고리즘으로 코드를 작성해보자.

1.X, Y 데이터 분리

y = df['Purchased']

X = df.loc[ : , ['Age','EstimatedSalary']]

2. Feature Scaling

from sklearn.preprocessing import StandardScaler

scaler_X = StandardScaler()

X = scaler_X.fit_transform(X)

3.Dataset을 Training 용과 Test용 나누기

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test =train_test_split(X,y, test_size=0.25 ,random_state=1)

 

 

 

4.KNN 알고리즘 사용하기

#분류기를 생성해준다.

classifier = KNeighborsClassifier(n_neighbors= 3)

#학습 데이터를 이용하여 모델을 학습한다.

classifier.fit(X_train,y_train)

# 테스트 데이터에 대해서 예측 수행한다.

y_pred = classifier.predict(X_test)

 

 

 

5. confusion_matrix, accuracy_score 확인