본문 바로가기

파이썬

(11)
[Machine Learing]머신러닝의 데이터 전처리과정(2)(Feature Scaling,Training,Test) 특성 스케일링(Feature Scaling)은 데이터 전처리 과정 중 하나로, 다른 특성들 간의 범위를 조정하여 모델의 성능을 향상시키는 작업이다. 표준화(Standardization): 평균을 빼고 표준 편차로 나누어 특성을 정규분포로 변환한다. 모든 특성의 평균이 0이고 표준 편차가 1이 된다. 주로 평균이 0이고 표준 편차가 1인 표준 정규 분포로 변환한다. 정규화(Normalization): 특성의 값을 0과 1 사이로 조정한다. 최소값을 뺀 다음 최대값과 최소값의 차이로 나누어 값을 조정한다. 모든 특성 값이 0과 1 사이에 있다.
[Machine Learning]머신러닝의 정의 및 사용되는 것(Supervised , Unsupervised) 머신러닝으로 할 수 있는 것 편지봉투에 손으로 쓴 우편번호 숫자 자동 판별 의료 영상 이미지에 기반한, 종양 판단 의심되는 신용카드 거래 감지 블로그 글의 주제 분류 고객들을 취향이 비슷한 그룹으로 묶기 여기에서 Supervised(지도학습)과 Unsupervised(비지도학습)은 머신러닝에서 사용되는 두 가지 주요한 학습 방법이다 Supervised Learning(지도학습): 지도학습은 입력 데이터와 정답(label 또는 target)을 함께 사용하여 모델을 학습시키는 방법이다. 모델은 입력 데이터와 정답(label) 간의 관계를 학습하여 새로운 데이터에 대한 예측을 수행할 수 있다. 주로 분류(Classification)와 회귀(Regression) 문제에 사용된다. 일반적인 알고리즘으로는 선형 회..
[파이썬 라이브러리]Matplotlib의 여러개의 변수 시각화방법(Scatter,Heat Maps) Scatterplots Scatterplots는 데이터 분석에서 두 변수 간의 관계를 시각화하는데 사용됩니다. 각각의 점은 데이터 집합에서 하나의 관측치를 나타내며, x축과 y축에 각각의 변수를 대응시킵니다. 이러한 점들은 그래프 상에서 흩어져 나타나며, 변수 간의 상관 관계를 파악하는데 도움이 됩니다. plt.figure(figsize=(8,10)) # 그래프의 크기를 설정합니다. (가로: 8인치, 세로: 10인치) # Seaborn 라이브러리를 이용하여 countplot을 그립니다. # data는 사용할 데이터프레임을 지정합니다. # y='make'는 y축에 표시할 열을 설정합니다. # order=my_order는 카테고리의 순서를 지정합니다. sb.countplot(data=df, y='make',..