판다스 (2) 썸네일형 리스트형 [Machine Learing]머신러닝의 데이터 전처리과정(2)(Feature Scaling,Training,Test) 특성 스케일링(Feature Scaling)은 데이터 전처리 과정 중 하나로, 다른 특성들 간의 범위를 조정하여 모델의 성능을 향상시키는 작업이다. 표준화(Standardization): 평균을 빼고 표준 편차로 나누어 특성을 정규분포로 변환한다. 모든 특성의 평균이 0이고 표준 편차가 1이 된다. 주로 평균이 0이고 표준 편차가 1인 표준 정규 분포로 변환한다. 정규화(Normalization): 특성의 값을 0과 1 사이로 조정한다. 최소값을 뺀 다음 최대값과 최소값의 차이로 나누어 값을 조정한다. 모든 특성 값이 0과 1 사이에 있다. [파이썬 라이브러리]Matplotlib의 여러개의 변수 시각화방법(Scatter,Heat Maps) Scatterplots Scatterplots는 데이터 분석에서 두 변수 간의 관계를 시각화하는데 사용됩니다. 각각의 점은 데이터 집합에서 하나의 관측치를 나타내며, x축과 y축에 각각의 변수를 대응시킵니다. 이러한 점들은 그래프 상에서 흩어져 나타나며, 변수 간의 상관 관계를 파악하는데 도움이 됩니다. plt.figure(figsize=(8,10)) # 그래프의 크기를 설정합니다. (가로: 8인치, 세로: 10인치) # Seaborn 라이브러리를 이용하여 countplot을 그립니다. # data는 사용할 데이터프레임을 지정합니다. # y='make'는 y축에 표시할 열을 설정합니다. # order=my_order는 카테고리의 순서를 지정합니다. sb.countplot(data=df, y='make',.. 이전 1 다음