label encoding (1) 썸네일형 리스트형 [Machine Learing]머신러닝의 데이터 전처리과정(1)(Label Encoding,One Hot Encoding) 데이터 전처리(Data Preprocessing)는 머신러닝 및 데이터 분석 작업에서 매우 중요한 단계 중 하나이다. 데이터 전처리는 데이터를 분석이나 모델링에 적합한 형태로 변환하고 준비하는 과정을 말한다. 이는 데이터의 품질을 향상시키고 모델의 성능을 향상시키는 데 도움이 된다. 데이터 정제(Cleaning): 이상치나 결측치와 같은 비정상적인 값들을 처리한다. 이는 데이터의 무결성을 보장하고 모델의 안정성을 높이는 데 도움이 된다. 그다음 X, Y 데이터 분리 : 즉 학습할 변수와 레이블링 변수로 분리 y = df['Purchased'] # 1차원은 변수를 소문자로 쓴다 X = df.loc[ : , 'Country':'Salary' ] #2차원은 변수를 대문자로 쓴다 먼저 from sklearn.p.. 이전 1 다음