데이터 분석
close
프로필 배경
프로필 로고

데이터 분석

  • 분류 전체보기 (205)
    • 내일배움캠프 (35)
    • SQL (33)
    • Python (15)
    • 데이터 전처리 & 시각화 (22)
    • 프로젝트 (50)
    • 통계 (Statistics) (18)
    • 머신러닝 (10)
    • Tableau (10)
    • 자격증 (3)
      • ADsP (1)
      • SQLD (2)
  • 홈
  • 태그
  • 방명록

[프로젝트 #4] 12월 26일(금) - TIL

어느덧 2025년이 일주일도 채 남지 않은 시점이 오고야 말았다... 진행사항오늘은 계속 PPT 장표와 노션 정리 내용을 번갈아가며 작업을 하였다. 튜터링ppt 흐름 : 내용이 방대하다보니,,, 15분 맞게 구상해야하는데요! -> 발표 생각말고 포트폴리오 만들 생각으로 장표 구성!!!(물론 내용을 나중에 빼더라도)그리고 포트폴리오로도 사용이 되려한다면 개선점?목차 (순서) 피드백프로젝트 배경배경 → 문제의식 정의 → 목표스타트업 생태계의 이해(간단히)무엇을 더 추가하면 좋을지??데이터 소개 → 11개 테이블에 대한 설명 구체적으로!출처, 범위, 내용ERD, 주요 컬럼 설명무엇을 더 추가하면 좋을지?? -> 11개의 테이블 모두 소개 페이지 넣을 것A : 성공에 대한 정의데이터 전처리 A: → 공통된 전..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 26.
  • textsms

[프로젝트 #4] 12월 24일(수) - TIL

스타트업 유형 군집을 돌리다가 계속되는 에러로,,, 일정관계상 PPT 제작 돌입 🎄크리스마스 이브 진행사항머신러닝 : 스타트업 군집 → 데이터 품질 처리 → PCA → KMeans → 엘보우와 실루엣, 군집 PPT 시작 팀 회의 | 결정사항PPT에 담을 내용 정리대시보드 연도는제외 → 산업별로만 필터링 하도록!머신러닝 xgboost 결과 → streamlit 적용 시도 튜터링매니저님 → 프로젝트 지원금 사용 관련 질의노트북 대여 관련 → 추후 운영 매니저가 절차 안내 예정 회고PPT 어떡하지 !? 내일 진짜 고민고민하고 채워야겠다!!

  • format_list_bulleted 프로젝트
  • · 2025. 12. 24.
  • textsms

[프로젝트 #4] 12월 23일(화) - TIL

머신러닝을 위한 테이블 생성과 대시보드 스케치에 대한 회의 진행 진행사항city, inst 구간화topN + other 구간화집계 과정에서 범주형 컬럼 가져올 때 주의점⚠️❌ 이유 - nan도 그냥 first로 잡힘- 운 나쁘면 다 nan 나옴 - 따라서, 결측이 있는 데이터에서 단독 사용 금지 팀 회의 | 결정사항수치형 결측치 중앙값으로 채워서 다시 해볼 것인코딩 후 계층군집 해볼것전처리 과정 : birthplace 카테고화 ← 나통계 과정 : 전처리 과정 birthplace에서 추가 카테고리화 ← 수아님success_master 만드는 과정 : 테이블 집계 - 조인 과정 재점검 ← 소희님 (모두함께)reinvest_flag → 수아님만 확인하면 되므로, 수아님이 조인해서 사용하기로!⇒ success..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 23.
  • textsms

[프로젝트 #4] 12월 22일(월) -TIL

이제 마지막 주차라고 생각하고 해야할 시기! 진행사항튜터링 후 스타트업 유형 피처 테이블 담기peo. birthplace에 제대로 매핑이 되어있지 않은 것들 재 전처리하여 매핑머신러닝을 위한 조인 팀 회의 | 결정사항수아, 소희 → 통계 심화채연, 재규 → 머신러닝 재규 → 스타트업 유형 군집, k-means (거리기반)f: 만 제외된 모든 창업자(투자기업의 창업자 포함) vs 투자기업의 창업자를 제외한 창업자(← 우리가 봐야할 것) 튜터링스타트업 유형 군집 + VC 유형 군집 주요피처 선택 시, 성공과 관련된 직접적인 피처는 제외할 것원-핫 : 고유값이 많을 때 → 구간화(1차 매핑) → 원-핫군집결과를 원본과 대치하여 비교범주를 숫자로 할때 기억해야할 것 회고그놈의 집계 기준!테이블이 많고, 데이터 ..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 22.
  • textsms

[프로젝트 #4] 12월 19일 (금) - TIL

오늘도 역시나 어김없이 찾아온 집계의 굴레 😵‍💫 오늘의 이슈1.나는 단지 rel(only founder) - peo - deg(최종학력)를 조인해서 founder_master를 만들면 되는 줄 알았으나,founder_master['rel_cf_id'] 에는 f: 값들도 존재하여 다시 정리하였음 → founder_master 생성# rel_p_id, rel_cf_id 기준 집계 : agg_founder_profileagg_founder_profile = founder_profile.groupby(['rel_p_id', 'rel_cf_id']).agg( is_past = ('is_past', 'first'), sequence = ('sequence', 'max'), b..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 19.
  • textsms

[프로젝트 #4] 12월 18일(목) - TIL

정말 거북이 걸음으로 나아가고 있다. 진행 사항founder_master 와 success_master 테이블 조인success_master 테이블에 회사(c:)가 여러행 분포해서 집계해서 조인을 해야함분석 목적은 "창업자 속성에 따른 성공률 분석" 이므로, 아래와 같이 집계를 했는데... agg_founder_success = founder_with_success.groupby('rel_p_id').agg( cnt_company = ('rel_cf_id', 'nunique'), # cnt_company : 창업자의 창업 횟수 founder_ever_success = ('founder_ever_success', 'first'), # founder_ev..

  • format_list_bulleted 프로젝트
  • · 2025. 12. 18.
  • textsms
  • navigate_before
  • 1
  • 2
  • 3
  • 4
  • ···
  • 35
  • navigate_next
전체 방문자
오늘
어제
전체
전체 카테고리
  • 분류 전체보기 (205)
    • 내일배움캠프 (35)
    • SQL (33)
    • Python (15)
    • 데이터 전처리 & 시각화 (22)
    • 프로젝트 (50)
    • 통계 (Statistics) (18)
    • 머신러닝 (10)
    • Tableau (10)
    • 자격증 (3)
      • ADsP (1)
      • SQLD (2)
최근 글
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바