데이터 분석
close
프로필 배경
프로필 로고

데이터 분석

  • 분류 전체보기 (205)
    • 내일배움캠프 (35)
    • SQL (33)
    • Python (15)
    • 데이터 전처리 & 시각화 (22)
    • 프로젝트 (50)
    • 통계 (Statistics) (18)
    • 머신러닝 (10)
    • Tableau (10)
    • 자격증 (3)
      • ADsP (1)
      • SQLD (2)
  • 홈
  • 태그
  • 방명록

[과제] 부동산 데이터셋 - 개인 프로젝트 과제 회고 📄

😵‍💫 추석연휴 기간 개인 과제2018 ~ 2024년도 부동산 데이터셋을 가지고 개인프로젝트(?) 과제를 진행했다.아직은 미숙한지라 2~3일 정도 걸리긴 했지만, 헷깔린 부분 제외 16번까지 풀어보았다. 🤪 문제점 발견목요일 14시 팀원들과 젭에 모여 공유하는 시간을 가졌다.(3명 모임)우선 다들 과제를 진행 중이라고 하셨고, 나는 모두 풀어는 보았으니 내가 진행한 내용들을 공유했다.그렇게 화면공유를 하면서 설명하며 공유하다보니까 혼자 생각할 때는 몰랐던 것들 그리고 이상했던 것의 원인을 발견하게 되었다. > 중복값 처리 일단 나는 분석 전처리 과정에서 분석에서 중요하지 않거나 필요하지 않은 컬럼(열)들은 과감히 삭제하는 판단을 내렸다.전체 컬럼들 중에서print(df.columns.to_list(..

  • format_list_bulleted 데이터 전처리 & 시각화
  • · 2025. 10. 9.
  • textsms
[시각화/과제] pandas 시각화 미니과제 - Seaborn 실습

[시각화/과제] pandas 시각화 미니과제 - Seaborn 실습

😏 h&m 고객 데이터를 가지고 시각화 실습 : 미니과제를 풀어보자!! ▶ 사전 준비 과정 → 라이브러리 임포트 | 한글 인코딩 해결 | 데이터 불러오기# 공통 셋업import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltplt.rcParams["font.family"] = "AppleGothic" # windowsms Malgun Gothic 권장plt.rcParams["axes.unicode_minus"] = False%matplotlib inline# 데이터 로드hm_path = "customer_hm.csv"hm = pd.read_csv(hm_path)hm.head()문제1. 멤버 상태별 고객 수질문) 멤버 상태별 고객 수는..

  • format_list_bulleted 데이터 전처리 & 시각화
  • · 2025. 9. 26.
  • textsms
[전처리/과제] pandas 전처리 미니과제(3) - 그룹화 및 Aggregation | 문자열 처리 | 시간 데이터 처리 | 데이터 결합 | apply & map & lambda 활용

[전처리/과제] pandas 전처리 미니과제(3) - 그룹화 및 Aggregation | 문자열 처리 | 시간 데이터 처리 | 데이터 결합 | apply & map & lambda 활용

실습문제 파헤치기🔍 customer_hm.csv🚨 처음에 {LEFT : '탈퇴'}를 맵핑하니 적용이 안됨. 그래서 .unique()를 찍어 고유 값을 확인!! 역시나!! ➡️ LEFT CLUB이었네!💡 위에 코드처럼 한 줄의 길이가 길어지면 가독성면에서 아쉬움. 그래서 맵핑부분을 변수로 넣어서 활용해보자!!status_map = {'ACTIVE': '활동', 'PRE-CREATE': '사전생성', 'LEFT CLUB': '탈퇴'}df['status_ko'] = df['club_member_status'].map(status_map)🚨 처음 시도할 때 : lambda x: '10대' if x 고민한 이유는 else와 '20-30대'가 한 묶음으로 생각했어서... 💡 위 코드처럼, if를 계속 적어..

  • format_list_bulleted 데이터 전처리 & 시각화
  • · 2025. 9. 24.
  • textsms
[전처리/복습] 데이터 전처리 부실공사 보수하고 기초부터 탄탄하게!(3) - 그룹화 및 Aggregation | 문자열 처리 | 시간 데이터 처리 | 데이터 결합 | apply &map & lambda 활용

[전처리/복습] 데이터 전처리 부실공사 보수하고 기초부터 탄탄하게!(3) - 그룹화 및 Aggregation | 문자열 처리 | 시간 데이터 처리 | 데이터 결합 | apply &map & lambda 활용

1. 그룹화 및 Aggregation # titanic_df 데이터 사용titanic_df.groupby('Embarked')['Survived'].mean()>>> 값이 0, 1로만 이루어져 있어서 평균값은 생존자 비율과 같다.# 객실등급(Pclass)별 최고령 승객의 나이(Age)titanic_df.groupby('Pclass')['Age'].max()2. 문자열 처리문자열 데이터 처리는 매우 중요. Series.str ➡️ df['컬럼'].str.매서드( ) 형식으로 사용 ▶ 대소문자 변환: .lower(), .upper(), .capitalize(), .title() 등 ▶ 공백 제거: .strip() (문자열 양 끝 공백 제거), .lstrip(), .rstrip() ▶ 길이 계산:..

  • format_list_bulleted 데이터 전처리 & 시각화
  • · 2025. 9. 23.
  • textsms
[전처리/과제] pandas 전처리(2) - 조건 필터링 | 데이터 정렬&정제 | 결측치&중복값 처리

[전처리/과제] pandas 전처리(2) - 조건 필터링 | 데이터 정렬&정제 | 결측치&중복값 처리

🎯 이제 조건 필터링은 재밌게 해볼 수 있을 것 같다! 아니야... 아직 먼 것 같다...결측치를 처리할 때 열 삭제 / 행 삭제가 아직 조금은 헷깔리는(🤔) 듯 하다... 신기한 단축키를 배웠다!!! ➡️ alt(option) +shift + 아래 방향키 : 해당줄 아래복사😌 과제 후 회고 및 느낀점이번 전처리 세션과 미니과제를 통해 배운 것 그리고 방법들을 다음 프로젝트에 반드시 적용해야겠다는 생각이 들었다. 지난 번 프로젝트 때 아쉬운 점들이 많아서 그런지 그 욕구가 더 커지는 듯 하다.아쉬운 점을 두 가지만 나열해 보자면 다음과 같다.1️⃣ customer | transactions | articles 3개의 파일에서 결측치, 중복값을 처리하고 저장한 새로운 파일로 진행했던 점2️⃣ 전처리..

  • format_list_bulleted 데이터 전처리 & 시각화
  • · 2025. 9. 19.
  • textsms
[전처리/복습] 데이터 전처리 부실공사 보수하고 기초부터 탄탄하게!(1) - Series&DataFrame | 인덱싱/슬라이싱

[전처리/복습] 데이터 전처리 부실공사 보수하고 기초부터 탄탄하게!(1) - Series&DataFrame | 인덱싱/슬라이싱

1️⃣ 데이터 전처리 (Pandas)도대체 데이터 전처리가 왜 중요해?모델/분석 전에 쓸 수 있는 상태로 만드는 과정: 결측·이상치·타입·중복·스케일·인덱스 정리잘한 전처리 = 노이즈↓, 해석력/성능/재현성↑ 2️⃣ 판다스는 뭐 어떻게 설치해? 3️⃣ 판다스 주요 데이터 타입은 뭐가 있지? 4️⃣ 시리즈(Series)가 뭐야?값(values) + 인덱스(index)가 있는 1차원 자료. DataFrame의 한 컬럼이 Series직접 생성 시 pd.Series✅ 인덱스와 값만 존재한다. 컬러명이 없음!! 있으면 그건 데이터프레임 이다! 5️⃣ 데이터프레임(DataFrame)이 뭐야?행(row)/열(column)이 있는 2차원 표, 여러 Series의 모음직접 생성 시 pd.DataFrame 6️..

  • format_list_bulleted 데이터 전처리 & 시각화
  • · 2025. 9. 16.
  • textsms
  • navigate_before
  • 1
  • 2
  • navigate_next
전체 방문자
오늘
어제
전체
전체 카테고리
  • 분류 전체보기 (205)
    • 내일배움캠프 (35)
    • SQL (33)
    • Python (15)
    • 데이터 전처리 & 시각화 (22)
    • 프로젝트 (50)
    • 통계 (Statistics) (18)
    • 머신러닝 (10)
    • Tableau (10)
    • 자격증 (3)
      • ADsP (1)
      • SQLD (2)
최근 글
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바