본문 바로가기

Machine Learning

[Machine Learning]머신러닝의 정의 및 사용되는 것(Supervised , Unsupervised)

머신러닝으로 할 수 있는 것

  • 편지봉투에 손으로 쓴 우편번호 숫자 자동 판별
  • 의료 영상 이미지에 기반한, 종양 판단
  • 의심되는 신용카드 거래 감지
  • 블로그 글의 주제 분류
  • 고객들을 취향이 비슷한 그룹으로 묶기

 

여기에서 Supervised(지도학습)과 Unsupervised(비지도학습)은 머신러닝에서 사용되는 두 가지 주요한 학습 방법이다

Supervised Learning(지도학습):

  • 지도학습은 입력 데이터와 정답(label 또는 target)을 함께 사용하여 모델을 학습시키는 방법이다.
  • 모델은 입력 데이터와 정답(label) 간의 관계를 학습하여 새로운 데이터에 대한 예측을 수행할 수 있다.
  • 주로 분류(Classification)와 회귀(Regression) 문제에 사용된다.
  • 일반적인 알고리즘으로는 선형 회귀, 로지스틱 회귀, 결정 트리, 랜덤 포레스트, 신경망 등이 있다.

Unsupervised Learning(비지도학습):

 

  • 비지도학습은 정답(label 또는 target)이 주어지지 않은 상태에서 데이터의 구조나 패턴을 찾는 방법이다.
  • 모델은 입력 데이터의 내부 구조를 학습하여 데이터 간의 유사성이나 패턴을 파악한다.
  • 주로 군집화(Clustering)와 차원 축소(Dimensionality Reduction) 문제에 사용된다.
  • 일반적인 알고리즘으로는 K-means 군집화, DBSCAN, PCA(주성분 분석), t-SNE 등이 있다.

Supervised 두가지 해결 방법

Regression(회귀) 과 Classification(분류)

 

Regression(회귀):회귀는 연속형 변수에 대한 예측을 위한 지도학습 방법이다. 예를 들어, 주택 가격 예측과 같이 연속적인 값을 예측할 때 사용된다.

Classification(분류): 분류는 주어진 입력 데이터를 여러 범주 또는 클래스 중 하나로 분류하는 작업을 의미한다 예를 들어, 이메일이 스팸인지 아닌지 분류하는 작업에 사용된다.

 

 

Supervised Learning은 정답이 주어진 상태에서 모델을 학습시키고, Unsupervised Learning은 정답이 주어지지 않은 상태에서 모델이 데이터의 구조나 패턴을 학습하는 것이다.