08_판다스 결측치 확인

import pandas as pd
df = pd.read_excel('score.xlsx', index_col='지원번호')

  • fillna
df.fillna('') # NaN 데이터를 빈 칸으로 채움
df.fillna('없음') # NaN 값을 '없음'으로 채움

--> 저장시 inplace=True 또는 변수로 다시 설정 

 

df['SW특기'].fillna('확인중', inplace=True) # SW특기 데이터 중에서 NaN에 대해서 채움

  • 데이터 제외하기 dropna
df.dropna(inplace=True)  # 전체 데이터 중에서 NaN을 포함하는 데이터 삭제

- dropna 조건 : axis, how

-- axis : index or columns

-- how : any or all

df.dropna(axis='index', how='any') # NaN이 하나라도 있는 row 삭제

df.dropna(axis='columns', how='any')  # NaN 값이 있는 column 삭제

 

'Python > 데이터분석' 카테고리의 다른 글

10_판다스 데이터 수정  (0) 2022.07.14
09_판다스 데이터 정렬  (0) 2022.07.14
07_판다스 데이터 선택(조건)  (0) 2022.07.14
06_판다스_데이터_선택  (0) 2022.07.10
05_판다스 데이터 확인  (0) 2022.07.09