본문 바로가기

Machine Learning

[Machine Learning]머신러닝의 Decision Tree 알고리즘

Decision Tree

Decision Tree는 데이터를 분류하거나 예측하는 모델 중 하나

Decision Tree 알고리즘을 이용하여 코드를 작성해보자

1.X, Y 데이터 분리

y = df['Purchased']

X = df.loc[ : , ['Age','EstimatedSalary']]

2. Feature Scaling

from sklearn.preprocessing import StandardScaler

scaler_X = StandardScaler()

X = scaler_X.fit_transform(X)

3.Dataset을 Training 용과 Test용 나누기

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test =train_test_split(X,y, test_size=0.25 ,random_state=1)

 

 

 

 

4.Decision Tree 알고리즘 사용하기

from sklearn.tree import DecisionTreeClassifier

# scikit-learn 라이브러리에서 DecisionTreeClassifier를 가져온다.

classifier = DecisionTreeClassifier(random_state=1)

# DecisionTreeClassifier 객체를 생성

# random_state는 모델을 학습할 때 사용되는 난수 발생 시드(seed)를 정의

classifier.fit(X_train,y_train)

# 훈련 데이터(X_train)와 훈련 레이블(y_train)을 사용하여 모델을 학습

y_pred = classifier.predict(X_test)

# 테스트 데이터(X_test)를 사용하여 모델이 예측한 값

y_pred

# 모델이 예측한 값을 출력

 

5.confusion_matrix,accuracy_score 구하기