[전처리/복습] 데이터 전처리 부실공사 보수하고 기초부터 탄탄하게!(3) - 그룹화 및 Aggregation | 문자열 처리 | 시간 데이터 처리 | 데이터 결합 | apply &map & lambda 활용
1. 그룹화 및 Aggregation # titanic_df 데이터 사용titanic_df.groupby('Embarked')['Survived'].mean()>>> 값이 0, 1로만 이루어져 있어서 평균값은 생존자 비율과 같다.# 객실등급(Pclass)별 최고령 승객의 나이(Age)titanic_df.groupby('Pclass')['Age'].max()2. 문자열 처리문자열 데이터 처리는 매우 중요. Series.str ➡️ df['컬럼'].str.매서드( ) 형식으로 사용 ▶ 대소문자 변환: .lower(), .upper(), .capitalize(), .title() 등 ▶ 공백 제거: .strip() (문자열 양 끝 공백 제거), .lstrip(), .rstrip() ▶ 길이 계산:..