본문 바로가기

파이썬/판다스(Pandas)

[파이썬 라이브러리]판다스(Pandas) 결측값(NaN) 처리방법

 

Dealing with NaN (결측값) in Pandas

NaN(결측값) 처리 방법

데이터프레임에서 NaN(결측값)은 데이터가 누락되었음을 나타냅니다. 이러한 결측값을 처리하는 방법은 여러 가지가 있습니다.

  • 결측값 채우기(fillna)
  • 결측값 제거(dropna)
  • 결측값 대체(replace)

결측값 채우기 (fillna)

fillna 메서드를 사용하여 결측값을 특정 값으로 채울 수 있습니다. 예를 들어, 평균값이나 중앙값으로 채워 넣을 수 있습니다.

# NaN을 평균값으로 채우기
df.fillna(df.mean(), inplace=True)
print(df)

결측값 제거 (dropna)

dropna 메서드를 사용하여 결측값이 있는 행이나 열을 제거할 수 있습니다.

# 결측값이 있는 행 제거
df.dropna(axis=0, inplace=True)
print(df)

결측값 대체 (replace)

replace 메서드를 사용하여 결측값을 다른 값으로 대체할 수 있습니다.

# 결측값을 0으로 대체하기
df.replace(np.nan, 0, inplace=True)
print(df)