본문 바로가기

Machine Learning

[Machine Learning]머신러닝의 Support Vector Machine(SVM)알고리즘

SVM이란?

Support Vector Machine(SVM)은 데이터를 분류하기 위한 지도학습 알고리즘 중 하나이다. 주어진 데이터를 가장 잘 나누는 초평면(hyperplane)을 찾는 것이 SVM의 목표이다. 이를 통해 데이터를 분류하거나 회귀하는 데 사용될 수 있다.

1. SVC의 작동 원리

1.X, Y 데이터 분리

y = df['Purchased']

X = df.loc[ : , ['Age','EstimatedSalary']]

2. Feature Scaling

from sklearn.preprocessing import StandardScaler

scaler_X = StandardScaler()

X = scaler_X.fit_transform(X)

3.Dataset을 Training 용과 Test용 나누기

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test =train_test_split(X,y, test_size=0.25 ,random_state=1)

 

 

 

 

 SVC의 작동 원리

SVC는 SVM을 구현한 scikit-learn 라이브러리의 클래스 중 하나

SVC의 작동 원리

SVC는 주어진 데이터를 가장 잘 분류하는 결정 경계(decision boundary)를 찾는 데 사용된다. 이 결정 경계는 데이터 포인트와 가능한 한 멀리 떨어져 있어야 한다. 이를 위해 SVC는 서포트 벡터(support vector)를 찾아내어 최적의 결정 경계를 찾음