issue 사항
계속되는 전처리 파일 수정!
- 어제에 이어진 시간(time)컬럼에 대한 정리 및 수정
- 프로모션유형에서 "정보만 제공"인 애들은 프로모션 완료가 없어서 "전환여부" 피쳐를 새로 만들어낼 때 계산에 유의 필요!
이를 보완하고 개선하기 위해 전처리 담당자님이 계속해서 고생하고 있다.
내 진행사항
- 통계 검정
- 연속형 변수 : 프로모션리워드금액, 프로모션유효기간(일), 나이]와 전환여부의 t-test
- 범주형 변수 : 마케팅채널과 전환여부의 독립성 검정, 카이제곱검정
팀 결정사항
- 데이터 중 "전환율" 관련 : 프로모션유형에서 "정보만제공"에는 프로모션완료 단계가 없기 때문에 다른 프로모션과 달라서, 이에 대한 논의 및 결정
- 태블로 대시보드 스케치
- PPT 구성 및 대략적 채울 내용
회고
각자의 방식대로 분석을 진행하고 결과만을 공유 하다보니, 전처리 방향이 계속해서 바뀌게 되는 상황이 일어나고 있는 것 같다. 그 이유는 각자가 데이터와 feature에 대한 이해가 다르고, 파생컬럼을 만들더라도 그 목적과 방향성이 다르기 때문에 무언가 미묘하게 서로 달라지게 되는 것 이다. 그렇기 때문에 같은거를 뽑아냈더라 하더라도 기준이 다를경우 결과값이 다르게 도출되는 것이다.
이런 문제점을 해결하는 방법은 사실 되게 간단하다. (어쩌면 어려울지도 모르지만)
각 단계를 시작 전, 어떤 목적을 가지고 분석을 진행할 것인지 모두 공유하고 그게 맞게 진행하면서 중간중간 진행상황을 모두와 나누는 것이다. 쉽지만 어렵다.
사실 이전 팀까지는 각 단계별로 탐색적 EDA나 통계 등 과정에서 각자가 진행했던 코드들을 모두 공유하는 식으로 진행을 했었는데, 계속해서 전처리 방향이 변경되는 것은 그렇게 진행하지 않는 것 때문일까 라는 생각이 들었다. 팀을 탓하는 내용은 아니다. 상황이 그렇게 흘러갔다는 사실을 기록하는 것이다.
이틀 전까지만 해도 모르면 그냥 검색하는 등의 방법으로 머리를 쥐어짜며 혼자하려고 했다. 그렇게 하는 것도 틀린 것은 아니라고 생각한다. 혼자 힘으로 해내는 것 또한 필요하다. 하지만 이것은 팀프로젝트 이다. 그렇게 혼자 해보려 하다가 목적과 방향성이 흘들릴 수 있다는 사실을 어느순간 인지하게 되었다. 그래서 방향에 대해 모르는 부분이 있을 때에는 바로 팀에 공유하고 나눈 의견으로 정리해서 다시 진행하는 편이 훨씬 팀에 도움이 된다는 것을 배우게 되었다.
내일 할 것
- 대시보드 구성 (대략 스케치는 했음)
- 통계 내용 정리 (팀원 모두 동일 기준 설정, 코드 공유 등)
- 머신러닝
- PPT - 전처리, EDA, 통계 내용 담기 (최대한)
'프로젝트' 카테고리의 다른 글
| [프로젝트 #3-7] 대시보드에 사용될 핵심 지표 KPI 결정 (0) | 2025.11.07 |
|---|---|
| [프로젝트 #3-5] time 컬럼에 대한 정의, 커뮤니케이션 error (0) | 2025.11.05 |
| [프로젝트 #3-3] 회귀분석 odds ratio / R square (0) | 2025.11.04 |