Decision Tree
Decision Tree는 데이터를 분류하거나 예측하는 모델 중 하나
Decision Tree 알고리즘을 이용하여 코드를 작성해보자
1.X, Y 데이터 분리
y = df['Purchased']
X = df.loc[ : , ['Age','EstimatedSalary']]
2. Feature Scaling
from sklearn.preprocessing import StandardScaler
scaler_X = StandardScaler()
X = scaler_X.fit_transform(X)
3.Dataset을 Training 용과 Test용 나누기
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test =train_test_split(X,y, test_size=0.25 ,random_state=1)
4.Decision Tree 알고리즘 사용하기
from sklearn.tree import DecisionTreeClassifier
# scikit-learn 라이브러리에서 DecisionTreeClassifier를 가져온다.
classifier = DecisionTreeClassifier(random_state=1)
# DecisionTreeClassifier 객체를 생성
# random_state는 모델을 학습할 때 사용되는 난수 발생 시드(seed)를 정의
classifier.fit(X_train,y_train)
# 훈련 데이터(X_train)와 훈련 레이블(y_train)을 사용하여 모델을 학습
y_pred = classifier.predict(X_test)
# 테스트 데이터(X_test)를 사용하여 모델이 예측한 값
y_pred
# 모델이 예측한 값을 출력
5.confusion_matrix,accuracy_score 구하기
'Machine Learning' 카테고리의 다른 글
[Machine Learning]머신러닝Unsupervised의Hierarchical Clustering (0) | 2024.04.16 |
---|---|
[Machine Learning]머신러닝Unsupervised의K-Means Clustering (0) | 2024.04.16 |
[Machine Learning]머신러닝의 Support Vector Machine(SVM)알고리즘 (0) | 2024.04.15 |
[Machine Learning]머신러닝의 KNN 알고리즘(K-Nearest Neighbor) (0) | 2024.04.15 |
[Machine Learning]머신러닝의Confusion Matrix 및accuracy_score 사용 (0) | 2024.04.15 |