분석의 '목적' 찾기 (문제 정의)

문제는 '도구'에만 집중했기 때문
"더 나은 의사결정을 돕기 위해" 데이터 분석을 함
모든 EDA, 모델링, 보고서는 "이 다음엔 무엇을 해야 하는가?"에 대한 답을 해야 함!
두가지 상황
- 현재(프로젝트)와 미래(현업)에서 만날 두가지 상황, 의사결정이 목표여야 함!
1. [bottom-up] 데이터셋만 있을 때 (현재)
이 데이터셋으로 어떤 의사결정에 도움을 줄 수 있을까?
상황A : 쇼핑물 유저행동 로그, 주문 내역 데이터셋
무엇을 해야할까?
!! 여기서 바로 EDA를 시작하면 안된다.
'의사결정'을 돕는 '가치 있는 질문'을 해야한다.
!! 질문의 흐름
1. 데이터의 보고 대상이 누구일지 모색해 보자
2. 이 데이터를 통해 어떤 의사결정이 필요할지 생각해 보자
(모호하다? 제공처의 비즈니스 모델이나 전체 goal을 생각해 본다 /예. 신규 유저 확보? 기존 유저 유지? 수익 증대?)
3. 어떤 output이 이 의사결정을 가장 잘 도울 수 있을지 정의하자
모델링? 이탈 예측 모델, 이탈 위험군 리스트
대시보드? 이탈률 현황 파악, 프로덕트의 health
인사이트 보고서? 의사결정을 돕는 여러 recommendation
✔️ 결국 먼저 틀을 잡는다!
질문으로 통해,
[그래서 저희는 이 쇼핑물이 어떤 고객에게 마케팅할지에 대한 결정하는 것을 돕기 위해,
이탈 위험군 예측이라는 주제를 정했다. 최종 선출물은 고위험 타겟 고객 리스트 입니다.]
2. [top-down] 문제가 주어졌을 때 (현업)
이 모호한 문제 뒤에 숨어 있는 찐 의사결정 니즈가 무엇을까?
상황 B : 우리 회사 힘들어, 리텐션 지표가 떨어짐. 어떻게 해야될까?
!! 여기서 SQL 부터 열면 안된다.
이 모호한 '현상'뒤에 숨겨진 '의사결정'을 찾아야함
1. STOP! 요청사항을 더 scope 한다.
- 리텐션의 정의가 뭔지? 어떻게 계산하고 있는지?
- 떨어지고 있다는 건 무엇과 비교해서 인건지?
2. 이 분석으로 어떤 의사결정이 필요한지 질문 so what?
- 요청자 니즈 : 사실 어제 배포한 신규 기능을 롤백 할지 말지 결정해야 해
- 해석 : 아 지금 필요한건 예측 모델이 아니라, 신규기능과 리텐션 하락의 Correlation 분석(상관관계)이구나!
3. 그 의사결정에 맞는 output에 대해 합의
- 의사결정 : 롤백 결정
- 아웃풋 : a/b 테스트 분석 결과 또는 신규 기능 사용자 vs 비사용자의 리텐션 비교 분석
⭐️ 이것이 분석적 사고 기반의 분석
우리는 질문을 통해서 어디서 시작해야하고, 어떻게 끝내야하는지 정의해야 한다.
보너스 팁 : devil's advocate (악마의 변호사)
본석/논리의 모든 단계를 스스로가 가장 신랄하게 공격하는 선의가 비판자가 되는 것
왜 이 훈련을?
- 논리의 치명적 허점을 찾고,
- 그에 대한 방어 로직을 만들고,
- 분석이 견고하고, 의미 있도록 만들기 위해!
1. 이 데이터를 믿을 수 있나?
2. 이 문제를 풀 가치가 있나? 의사결정과 무관하거나, 통계적 유의해도 비즈니스적 의미가 없는 차이 아닌지?
3. 이 결론은 진짜인가?
이런 딴지들을 방어할 수 있었을 때, 분석은 비로소 가치를 가지게 된다!!
> 다음회차 가설을 세우고 테스트 가능한 방법으로 변형하는 것
'내일배움캠프' 카테고리의 다른 글
| [세션] 데이터로 설득하는 시각화 기술 1회차 (0) | 2025.11.14 |
|---|---|
| GPT를 활용한 올바른 데이터 분석 학습법 (0) | 2025.09.15 |
| [SQL] SQL 코드카타 : 33번 상품 별 오프라인 매출 구하기 (0) | 2025.08.20 |