Dealing with NaN (결측값) in Pandas
NaN(결측값) 처리 방법
데이터프레임에서 NaN(결측값)은 데이터가 누락되었음을 나타냅니다. 이러한 결측값을 처리하는 방법은 여러 가지가 있습니다.
- 결측값 채우기(fillna)
- 결측값 제거(dropna)
- 결측값 대체(replace)
결측값 채우기 (fillna)
fillna 메서드를 사용하여 결측값을 특정 값으로 채울 수 있습니다. 예를 들어, 평균값이나 중앙값으로 채워 넣을 수 있습니다.
# NaN을 평균값으로 채우기
df.fillna(df.mean(), inplace=True)
print(df)
결측값 제거 (dropna)
dropna 메서드를 사용하여 결측값이 있는 행이나 열을 제거할 수 있습니다.
# 결측값이 있는 행 제거
df.dropna(axis=0, inplace=True)
print(df)
결측값 대체 (replace)
replace 메서드를 사용하여 결측값을 다른 값으로 대체할 수 있습니다.
# 결측값을 0으로 대체하기
df.replace(np.nan, 0, inplace=True)
print(df)
'파이썬 > 판다스(Pandas)' 카테고리의 다른 글
[파이썬 라이브러리]판다스(pandas) OPERATIONS과APPLYING FUNCTIONS (0) | 2024.04.08 |
---|---|
[파이썬 라이브러리]Pandas 여러 메서드(head,tail,describe,info,unique,groupby) (0) | 2024.04.05 |
[파이썬 라이브러리]Pandas 데이터프레임(DataFrame) 데이터 변경 및 삭제 (0) | 2024.04.05 |
[파이썬 라이브러리]Pandas 데이터프레임 데이터 접근하기 (0) | 2024.04.05 |
[파이썬 라이브러리]Pandas DataFrame 생성하기 및 예시 (0) | 2024.04.05 |