[데이터 전처리] 결측치 처리 (Missing Data)
결측치 처리결측치(Missing Data) : 데이터셋에서 값이 채우져 있지 않은 항목으로, 보통 빈 값, NULL. NaN(Not a Number) 등의 형태로 표현결측치는 분석을 방해하고 잘못된 결과를 유발할 수 있으므로, 본격적인 분석 전에 반드시 처리해야 합니다. 처리 방법은 상황에 따라 삭제(drop)하거나 대체(impute) 하는 것이 일반적입니다. 결측치 확인isnull()/notnull(): 판다스 Series나 DataFrame의 각 원소가 결측치인지 아닌지를 True/False로 나타내는 동일한 모양의 객체를 반환합니다. df.isnull()은 결측이면 True, 값이 있으면 False를 줍니다. 반대로 df.notnull()은 값이 있으면 True입니다.결측치 개수 파악: df.is..