데이터 분석
close
프로필 배경
프로필 로고

데이터 분석

  • 분류 전체보기 (205)
    • 내일배움캠프 (35)
    • SQL (33)
    • Python (15)
    • 데이터 전처리 & 시각화 (22)
    • 프로젝트 (50)
    • 통계 (Statistics) (18)
    • 머신러닝 (10)
    • Tableau (10)
    • 자격증 (3)
      • ADsP (1)
      • SQLD (2)
  • 홈
  • 태그
  • 방명록

[프로젝트 #4] 12월 26일(금) - TIL

어느덧 2025년이 일주일도 채 남지 않은 시점이 오고야 말았다... 진행사항오늘은 계속 PPT 장표와 노션 정리 내용을 번갈아가며 작업을 하였다. 튜터링ppt 흐름 : 내용이 방대하다보니,,, 15분 맞게 구상해야하는데요! -> 발표 생각말고 포트폴리오 만들 생각으로 장표 구성!!!(물론 내용을 나중에 빼더라도)그리고 포트폴리오로도 사용이 되려한다면 개선점?목차 (순서) 피드백프로젝트 배경배경 → 문제의식 정의 → 목표스타트업 생태계의 이해(간단히)무엇을 더 추가하면 좋을지??데이터 소개 → 11개 테이블에 대한 설명 구체적으로!출처, 범위, 내용ERD, 주요 컬럼 설명무엇을 더 추가하면 좋을지?? -> 11개의 테이블 모두 소개 페이지 넣을 것A : 성공에 대한 정의데이터 전처리 A: → 공통된 전..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 26.
  • textsms

[프로젝트 #4] 12월 19일 (금) - TIL

오늘도 역시나 어김없이 찾아온 집계의 굴레 😵‍💫 오늘의 이슈1.나는 단지 rel(only founder) - peo - deg(최종학력)를 조인해서 founder_master를 만들면 되는 줄 알았으나,founder_master['rel_cf_id'] 에는 f: 값들도 존재하여 다시 정리하였음 → founder_master 생성# rel_p_id, rel_cf_id 기준 집계 : agg_founder_profileagg_founder_profile = founder_profile.groupby(['rel_p_id', 'rel_cf_id']).agg( is_past = ('is_past', 'first'), sequence = ('sequence', 'max'), b..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 19.
  • textsms

[프로젝트 #4] 12월 18일(목) - TIL

정말 거북이 걸음으로 나아가고 있다. 진행 사항founder_master 와 success_master 테이블 조인success_master 테이블에 회사(c:)가 여러행 분포해서 집계해서 조인을 해야함분석 목적은 "창업자 속성에 따른 성공률 분석" 이므로, 아래와 같이 집계를 했는데... agg_founder_success = founder_with_success.groupby('rel_p_id').agg( cnt_company = ('rel_cf_id', 'nunique'), # cnt_company : 창업자의 창업 횟수 founder_ever_success = ('founder_ever_success', 'first'), # founder_ev..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 18.
  • textsms

[프로젝트 #4] 12월 16일(화) - TIL

이제 2주 밖에 안남았다니,,, 실감이 안나면서 시간이 너무 빠르게 흘러간다는 생각이 든다. (Time flies like an arrow) 팀 결정사항통계, 머신러닝에 사용할 파생변수 생성통계검정을 위한 가설설정더보기[대가설]성공 스타트업과 실패 스타트업은 기업 및 투자 특성에 따라 유의미한 차이가 있다[설명] 성공, 실패 스타트업 간 차이가 실제로 존재하는지 통계적으로 검정하는 단계 [분석목적] 어떤 스타트업이 VC의 투자 성공과 유의미하게 연결되는가 ? [하위가설]1. 스타트업 특성별 투자 성공률이 달라진다1-1) IT 산업군의 투자 성공률이 높다.1-2) 투자 건수 IQR기준 상위 25% 산업군의 투자 성공률이 상대적으로 높다. 1-3) 타 산업군에 비해 표본수가 부족한 산업군은 투자 성공률이 ..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 16.
  • textsms

[프로젝트 #4] 12월 15일(월) - TIL

재규* degree 부분에 0(other-No degree)에 대해 검토필요 * 전처리 최신파일로 된 건지 확인필요* leadersip-change에 대해 접근방법 생각해보기* relationships 테이블 title 카테고리화 재정리 공통* 엑싯 성공률 > acquisiton, ipo 에서 헐값에 팔린 0값들> 투자 원금대비 가치 평가액이 높아야 이득 → 투자금 회수> 엑싯 성공률을 합쳐서 보면 안될듯 → 엑싯을 acq 비공개/0값 아닌 것들 ipo투자원금보다 가치금액 큰 것들,> other에 대해 세부 카테고리화* 오늘은 EDA 수정 → 추가 EDA 하면서 통계 병행 산업, 지역, 학력, 연도별, ACQ, IPO[통계를 위해]1. 성공/실패에 대한 명확한 정의 → 컬럼생성(파생변수)..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 15.
  • textsms

[프로젝트 #4] 12월 12일(금) - TIL

3일째 EDA 를 하고 있는 중이다. 주말에도 이어서 진행해야 할 듯 합니다... 진행사항CEO는 창업자 일수도 혹은 아닐수도 있다는 사실을 망각한 채 CEO/Founders를 묶어서 분석한 나.엑싯에 성공하는 창업자의 특징과 패턴을 찾기 위해서는 only Founders만 필터링해서 분석을 해야한다. relationships (title == founders) - people - objects (entity_type == company)] => rpo 관계1 row = 창업자 x 회사 x 회사의 exit_flag세그먼트별 exit_flag출생지역학력수준산업창업자 단위 exit_flag창업자가 한번이상 창업한 회사가 한번이라도 exit을 했는지!1 row = 창업자 x 학교 x 전공 x 한 창업자가 평생..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 12.
  • textsms
  • navigate_before
  • 1
  • 2
  • 3
  • 4
  • ···
  • 10
  • navigate_next
전체 방문자
오늘
어제
전체
전체 카테고리
  • 분류 전체보기 (205)
    • 내일배움캠프 (35)
    • SQL (33)
    • Python (15)
    • 데이터 전처리 & 시각화 (22)
    • 프로젝트 (50)
    • 통계 (Statistics) (18)
    • 머신러닝 (10)
    • Tableau (10)
    • 자격증 (3)
      • ADsP (1)
      • SQLD (2)
최근 글
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바