[프로젝트 #4] 11월 28일 TIL

진행사항

- 테이블 내 컬럼 그리고 테이블 간 관계성 파악(-ing)

- 1차 비즈니스 목표에서 더 구체적인 목표 설정 (-ing)

- 성공 / 실패 / 위기 정의


 Issue

테이블 간 JOIN 관계성 파악의 어려움

 

튜터링 FeedBack

모든 테이블(11개)을 하나로 join 하려고 하지 않아도 됨.

기준을 정해서 분석 목적에 맞는 테이블을 새로 만들어 EDA를 진행하면 좋음

  • 회사 기준 테이블
  • 이벤트(인수, ipo 등의 사건) 기준 테이블
  • 기타 등등

→ 이렇게 묶어놓고 각 기준이 되는 테이블 간의 관계를 알아보려면 → 연결 조인키가 있긴 해야함.

→ INNER JOIN, LEFT JOIN, RIGHT JOIN 도 목적에 맞게 잘 확인해서 적용시켜야 함.

→ 테이블이 사실 11개지만, 그 이상이 되어도 상관없음.


이어서 할 것

- 용어 정의(성공, 실패, 위기) -> 디벨롭

- 2차 세부 목적 -> 디벨롭

- 테이블 조인과 관계성 따져보기 -> 굳이 하나의 테이블로 만들지 않아도 됨.


회고

- 파이썬으로 테이블을 확인할 때보다, SQL로 테이블을 확인해보는 게 확실히 편하고 수월한 점이 있다.

- 분석할 테이블이 많을 때, 전부 하나로 수월하게 합칠 수 있다면 좋겠지만, 그 상황이 아닐 경우에는 기준에 맞는(ex. 객체 테이블, 이벤트 테이블 등) 테이블을 한 대 모아 조인해서 EDA를 하는 것도 방법이라는 것을 알게되었다.

- 아무튼 주말동안 도메인과 데이터에 대한 고민을 많이 해봐야겠다.