[프로젝트 #3-2] 탐색적 그리고 심층 EDA - 취합 및 방향 설정

영업일(?) 기준, 프로젝트 2일차

- 스타벅스 데이터셋

내 진행 사항

비거래자 특징을 보아, 스타벅스측(데이터 분석가 입장에서 제안해볼 수 있는)에서 조정이 가능한 요인은 아래 세 가지

  • 다양한 프로모션 경험(informational, discount, bogo 등)
  • 프로모션 리워드
  • 프로모션유효기간(일)
따라서 수익성을 높이고, 비거래자 비율을 낮추고 충성고객으로 유인하는 방법

- 현재 프로모션 외 추가적인 방법 고안([1+1], [가격할인] 외) : [1+1]보다는 [가격할인]을 더!
- 프로모션리워드를 높이는 방향
- 프로모션유효기간(일)을 짧게 (길어지면 중간에 멈추는 경향)

 

➡️ 당연한 얘기 인것 같기도 하고...?!! 그치만 데이터로 확인해봤다는 것에 의미가 있다.

 

 

프로모션 기간이 길어지면 달성금액도 동시에 증가하는 추세이지만, 거래로 이어지는 전환율은 감소하는 추세

프로모션유효기간 vs 전환율

프로모션유효기간 vs 프로모션달성금액

프로모션유형 x 이벤트유형 Crosstab

⇒ 프로모션완료 비교 : [1+1] 보다 [가격할인]의 경우가 완료 비율이 높았음

 

[확인해봐야 할 사항]

프로모션 받음 → 프로모션 확인 → 프로모션 완료 → 거래 : 순차적으로 진행된거라면 인원수 중복이 있는건가?

팀원과 구한 방식이 다름. ➡️ 이것도 사실은,,, 거래 → 프로모션 완료 순이라고 한다!

  • 나는 고유한 고객별로 집계(groupby)하여, 각각 프로모션 단계별 횟수를 확인했고,
  • 팀원은 고객을 집계하지 않고, 프로모션 단계를 고객수로 카운트하여 비율을 계산했음.

⇒ 어떤 것으로 정해야할지? 지금 내 생각으로는 팀원이 계산한 방식이 훨신 전처리 단계도 적고 쉬워보임.

➡️ 결국엔 팀원이 진행한 방향대로 진행!!


팀 결정사항

모두의 EDA 과정을 거쳐 하나의 관통하는 분석방향을 설정하였다.

(소득이 40-50대 대비 상대적으로 낮은)
📌 20-30대의 "프로모션 확인" → "프로모션 완료" 과정에서 이탈을 방지하고 전환율 유도 전략 마련!
- 과정에서 이탈하는 고객들의 특징 파악

회고

각자 EDA를 진행한 부분에 대해서 관통하는 핵심 주제를 선정하는 부분이 어려웠다.

 

또 다시 요약된 부분에 대해 나눠서 분석해보자는 의견이 나왔는데, 조심스럽게 "모두의 의견이 어떨지는 모르겠지만, 지금 시점에서는 관통하는 핵심주제를 정하고, 그 주제에서 파생되는 분석 내용에 대해 역할 분담을 하면 어떤가요..?"라고 내 의견을 전달했다.

나 스스로가 명확한 분석방향 없이 진행하는 부분에 대해서 약간은 갈피를 못잡고 있다고 사실대로 전달했고, 다행히도 팀원들은 그 의견을 들어주었다. 그래서 위와 같이 팀 결정사항을 정했고, 내일은 이 방향대로 내 분담에 대해 분석을 진행할 예정이다.

 

다시 한 번 느끼는 거지만, 말투와 비언어적 요소를 긍정적으로 한다면, 내 의사와 의견을 명확히 전달하는 것은 팀 프로젝트에서는 너무나도 중요한 부분인 것 같다.


내일 할 것

로지스틱 회귀분석 (Logistic Regression) 

목적: 전환 여부에 영향을 미치는 요인들의 효과 정량화

분석 설계:

  • 종속변수: 전환 여부 (completed = 1, 0)
  • 독립변수: 프로모션 유형, 채널 조합, 리워드, 유효기간, 성별, 연령대, 소득수준
  • 기대효과: 각 요인의 odds ratio를 통해 "리워드 1단위 증가 시 전환 확률 X% 증가" 같은 구체적 인사이트 도출

회귀분석 공부 좀 해야겠다...