데이터 분석
close
프로필 배경
프로필 로고

데이터 분석

  • 분류 전체보기 (205)
    • 내일배움캠프 (35)
    • SQL (33)
    • Python (15)
    • 데이터 전처리 & 시각화 (22)
    • 프로젝트 (50)
    • 통계 (Statistics) (18)
    • 머신러닝 (10)
    • Tableau (10)
    • 자격증 (3)
      • ADsP (1)
      • SQLD (2)
  • 홈
  • 태그
  • 방명록

[프로젝트 #4] 12월 12일(금) - TIL

3일째 EDA 를 하고 있는 중이다. 주말에도 이어서 진행해야 할 듯 합니다... 진행사항CEO는 창업자 일수도 혹은 아닐수도 있다는 사실을 망각한 채 CEO/Founders를 묶어서 분석한 나.엑싯에 성공하는 창업자의 특징과 패턴을 찾기 위해서는 only Founders만 필터링해서 분석을 해야한다. relationships (title == founders) - people - objects (entity_type == company)] => rpo 관계1 row = 창업자 x 회사 x 회사의 exit_flag세그먼트별 exit_flag출생지역학력수준산업창업자 단위 exit_flag창업자가 한번이상 창업한 회사가 한번이라도 exit을 했는지!1 row = 창업자 x 학교 x 전공 x 한 창업자가 평생..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 12.
  • textsms

[프로젝트 #4] 12월 11일(목) - TIL

오늘은 다들 각자 EDA하면서 시간을 보냈다. 창업자 관련 EDA출생지 x 회사상태(status)학력 x 회사상태(status)전공 x 회사상태(status)마일스톤 x 회사상태(status)학교 x 회사상태(status).... ing 결정사항EDA가 생각보다 중요하기 때문에 절차상 늦더라도 심도있게 이해하고 넘어가자 (월요일 아침 9시까지)PPT 레이아웃 해두고 내용을 바로바로 채우자 (내일부터) - 템플릿 선정 완료!EDA 내용 노션에 잘 정리할 것 회고데이터를 뽑아보면서 "어떻게 하면 심도 있는 인사이트를 잘 도출할 수 있을까?" 하는 걱정이 계속 든다.고민을 해본 결과를 정리하자면, 아무래도 생각의 깊이가 얕을 수 밖에 없는 이유는 EDA를 진행하면서 결과에 대한 "추가 질문을 스스로 던져보..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 11.
  • textsms

[프로젝트 #4] 12월 10월 (수) - TIL

오늘 프로젝트를 이어가면서 팀 단위 결정사항raised_amount == 0, pre_money_valuation_usd ==0, post_money_valuation_usd ==0 인 값 : 비공개로 볼 것인가?USD 통화로 되어있지 않은 amount 컬럼은 USD로 어떻게 적용할 것인가? 당시 환율 적용더보기# 해당기간의 환율 적용Funds['funded_at'] = pd.to_datetime(Funds['funded_at'])AUD = Funds[Funds['raised_currency_code']=="AUD"].copy()min_AUD = AUD['funded_at'].min()max_AUD = AUD['funded_at'].max()CAD = Funds[Funds['raised_currenc..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 10.
  • textsms

[프로젝트 #4] 12월 09일 (화) - TIL

오늘은 join 기준을 세우고 해보면서 검증해보는 시간을 가졌다.창업자의 패턴이나 특징을 파악하는 부분을 담당하게 됐다.오늘 알게된 것- people을 objects와 연결하기 위해서는 중간에 반드시 relationships이 있어야 한다.- 기준테이블이 있고 머지를 진행하면 결과 행수는 기준테이블보다 같거나 크다.- 머지를 위해서는 무엇을 보고싶은지 계속 질문을 해가면서 하면 도움이 된다. 회고오늘은 정말 멘탈이 오락가락했다. 이게 맞나 싶을 정도로 가능한 조인 방향이 너무 많았고, 우리 프로젝트 주제에서는 다소 중요도가 적은 엑싯에 성공한 스타트업 창업자의 특징(?)에 있어서 볼 수 있는 것이 매우 한정적이고, 테이블 연결관계도 복잡스러웠다(주관적인 생각). 어느정도 정리는 된 것 같은데,, 내일..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 9.
  • textsms
[프로젝트 #3-2] 탐색적 그리고 심층 EDA - 취합 및 방향 설정

[프로젝트 #3-2] 탐색적 그리고 심층 EDA - 취합 및 방향 설정

영업일(?) 기준, 프로젝트 2일차- 스타벅스 데이터셋내 진행 사항비거래자 특징을 보아, 스타벅스측(데이터 분석가 입장에서 제안해볼 수 있는)에서 조정이 가능한 요인은 아래 세 가지다양한 프로모션 경험(informational, discount, bogo 등)프로모션 리워드프로모션유효기간(일)따라서 수익성을 높이고, 비거래자 비율을 낮추고 충성고객으로 유인하는 방법은- 현재 프로모션 외 추가적인 방법 고안([1+1], [가격할인] 외) : [1+1]보다는 [가격할인]을 더! - 프로모션리워드를 높이는 방향 - 프로모션유효기간(일)을 짧게 (길어지면 중간에 멈추는 경향) ➡️ 당연한 얘기 인것 같기도 하고...?!! 그치만 데이터로 확인해봤다는 것에 의미가 있다. 프로모션 기간이 길어지면 달성금액도 동시..

  • format_list_bulleted 프로젝트
  • · 2025. 11. 3.
  • textsms
[프로젝트 #2-4] EDA 1차 진행 : 단변량/다변량 분석 | 파생변수는 어쩌지...?

[프로젝트 #2-4] EDA 1차 진행 : 단변량/다변량 분석 | 파생변수는 어쩌지...?

심화 프로젝트 4일차(벌써)... 다 같이 전처리 파일로 EDA (1차)를 진행하였다. 오늘 내가 진행한 내용 - host_is_superhost 컬럼으로 슈퍼호스트 여부(슈퍼/일반)에 따른 분포를 알아보고자 시각화 진행.(단변량 분석)코드스니펫더보기# 1. host_id 기준으로 중복 제거 (첫 번째 행 유지)df_unique_host = df_pp.drop_duplicates(subset=['host_id'], keep='first')# 2. 유니크한 호스트들만 있는 데이터프레임에서 슈퍼호스트 여부 분석print("\n" + "="*60)print("고유한 host_id 기준으로 슈퍼호스트 분포 분석")print("="*60)# 슈퍼호스트 분포 계산print("\n[호스트의 슈퍼호스트 비율]")uni..

  • format_list_bulleted 프로젝트
  • · 2025. 10. 16.
  • textsms
  • navigate_before
  • 1
  • 2
  • navigate_next
전체 방문자
오늘
어제
전체
전체 카테고리
  • 분류 전체보기 (205)
    • 내일배움캠프 (35)
    • SQL (33)
    • Python (15)
    • 데이터 전처리 & 시각화 (22)
    • 프로젝트 (50)
    • 통계 (Statistics) (18)
    • 머신러닝 (10)
    • Tableau (10)
    • 자격증 (3)
      • ADsP (1)
      • SQLD (2)
최근 글
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바