[통계/Q&A] 가설검정 관련 질문 답변

질문 1:  t-분포가 아니라 다른 분포로 가설검정을 하더라도 p-value와 신뢰구간으로 가설검정하는 것은 동일한가요?

 

네, p-value 사용은 모든 검정에서 동일합니다! 어떤 분포(t분포, 카이제곱, F분포 등)를 사용하든 p-value의 의미와 판단 기준은 똑같아요.

 

p-value의 의미 (모든 분포 공통):
• 귀무가설이 참이라고 가정했을 때, 지금 내 데이터같은 극단적 결과가 나올 확률
• 판단 기준: p-value < 0.05 → 귀무가설 기각!

 

신뢰구간은 가설 검정에 쓰일 수도 있지만 주로 모수 추정 (평균, 분산 등)에 쓰인다고 보면 돼요.
예를 들면 95% 신뢰 구간으로 모집단의 평균이 대략 얼마인지 구간을 통해 추정합니다.
그래서 가설 검정시 신뢰구간은 생각안해주셔도 됩니다.


질문 2: 동일하다면 다른 분포로 가설 검정을 하는 것은 분포마다 달라지는 것이 무엇인가요? 계산방법이 달라지는 것인가요?

 

어떤 검정을 할때 마다 사용해야하는 분포도 달라지고, 또한 각 분포마다 p-value를 계산 방법이 달라져요.

 

1. 검정 목적에 따라 사용하는 분포가 다름

• 평균 검정 → t분포 사용
  - 목적: 두 그룹의 평균에 차이가 있는지 검정
  - 왜? 표본평균의 분포가 t분포를 따르기 때문
  - 예: 신메뉴 vs 구메뉴 매출 비교, A/B테스트 전환율 비교

 

• 독립성 검정 → 카이제곱분포 사용 

 - 목적: 두 범주형 변수가 서로 독립적인지 검정
  - 왜? (관측-기대)²/기대 의 합이 카이제곱분포를 따르기 때문
  - 예: 성별과 구매여부 관련성, 지역별 선호도 차이

 

• 분산의 동일성 검정 → F분포 사용

  - 목적: 두 그룹의 분산(변동성)에 차이가 있는지 검정
  - 왜? 두 분산의 비율(s₁²/s₂²)이 F분포를 따르기 때문
  - 예: 두 공장의 품질 균일성 비교 (불량률 편차가 다른지)
  - 예: 두 지점 매출 변동성 비교 (어느 지점이 더 안정적인지)

 

• 비율 검정 → 이항분포 기반 (표본 크면 정규근사 사용)

  - 목적: 두 그룹의 비율(확률)에 차이가 있는지 검정
  - 왜? 성공/실패의 이항시행 결과가 이항분포를 따르기 때문
  - 예: 클릭률 3% vs 5% 차이 검정 (광고 A vs 광고 B)

 

 

2. 각 분포마다 p-value 계산 방법이 다름

각 분포별 p-value 계산 과정 (Python의 라이브러리가 자동으로 계산 해주니 수식은 이해를 위한 용도로 보세요!)

 

t-분포에서 p-value 구하기:
1. t통계량 = (평균차이)/(표준오차) 계산
2. 자유도 = n1 + n2 - 2 계산
3. t분포의 누적분포함수(CDF)로 p-value 계산
4. 1~3 과정을 우리가 직접 계산 안하고 Python에서 자동 계산됨

- stats.ttest_ind(그룹A, 그룹B) → p-value 바로 나옴!

 

카이제곱분포에서 p-value 구하기:
1. χ²통계량 = Σ(관측빈도-기대빈도)²/기대빈도 계산
2. 자유도 = (행-1) × (열-1) 계산
3. 카이제곱분포의 누적분포함수(CDF)로 p-value 계산
4. 1~3 과정을 우리가 직접 계산 안하고 Python에서 자동 계산됨

- stats.chi2_contingency(교차표) → p-value 바로 나옴!

 

 F분포에서 p-value 구하기:
1. F통계량 = 분산₁/분산₂ 계산
2. 자유도1 = n1-1, 자유도2 = n2-1 계산
3. F분포의 누적분포함수(CDF)로 p-value 계산
4. 1~3 과정을 우리가 직접 계산 안하고 Python에서 자동 계산됨

- stats.levene(그룹1, 그룹2)  → p-value 바로 나옴!

 

핵심 정리:
• 각 분포마다 통계량 계산식이 다름 (t는 평균차이, χ²는 빈도차이, F는 분산비율)
• 각 분포마다 자유도 계산 방법이 다름
• 각 분포마다 고유한 확률분포 모양을 가짐
• 하지만 Python 함수가 모든 계산을 자동으로 처리해줌
• 우리는 적절한 검정을 선택하고 데이터를 넣어서 p-value를 확인해 귀무가설을 기각할지 판단하면 됩니다!


질문 3: 가설 검정을 실제로 할 때 항상 이 표본이 어떤 분포이다! 라고 확인을 한 뒤 어떤 가설검정 방법으로 할 지 정하는 건가요?

 

아니에요. 일반적으로 표본이 어떤 분포다라고 확인할 수 없는 경우가 훨씬 많습니다.
그래서 가설검정 방법 정할 때 무엇보다 중요한 것은 분석 목적과 데이터의 타입, 그룹 수 등 "무엇을 분석하려는지"가 검정 방법을 결정합니다!

 

가설검정 방법 결정 과정

1. 목적이 뭔가?
• "두 그룹 평균 차이를 보고 싶어" → t-검정 쓸 거야
• "3개 이상 그룹 평균 차이를 보고 싶어" → ANOVA (F분포) 쓸 거야
• "두 범주형 변수간 관계를 보고 싶어" → 카이제곱 쓸 거야
• "두 그룹 비율 차이를 보고 싶어" → 비율검정 쓸 거야
• "두 그룹 분산 차이를 보고 싶어" → F-검정 쓸 거야

 

2. 데이터가 뭔가?
• 연속형 데이터의 그룹별 평균 비교 (매출, 시간, 점수) → 2개 그룹: t검정,  3개 이상 그룹: ANOVA (F분포 사용)
• 범주형 데이터간 관계/독립성 검정 (성별vs구매, 지역vs선호도) → 카이제곱 써야 함
• 그룹별 비율/확률 비교 (클릭률, 전환율, 합격률) →  비율검정 써야 함
• 그룹별 분산(변동성) 비교 (품질편차, 매출변동성) → F검정 써야 함

 

3. 조건 확인 (각 검정에서의 필요 조건도 공부할 때 잘 정리해두세요)
조건 확인 후 검정 방법 선택
• 조건 만족 → 원래 계획한 모수 검정 사용 (정규분포 등 분포 가정하는 검정)
• 조건 불만족 → 비모수 검정으로 전환 (분포 가정 없이 순위 기반 검정)

 

(1) t-검정
• n≥30 → 정규성 체크 불필요 (중심극한정리 때문에 불필요)
• n<30 → Shapiro-Wilk test로 정규성 확인, p>0.05면 정규분포

• 독립표본(서로 다른 그룹) 비교시 → Levene's test로 등분산성(두 그룹 퍼진 정도 비슷한지) 확인, p>0.05면 등분산

 

• 등분산성 위배시 → Welch's t-test 사용
• 정규성 위배시 → Mann-Whitney U test 사용 (비모수 대안)

 

(2) 카이제곱검정
• 정규성 확인 불필요 (범주형이라 애초에 의미없음)
• 기대빈도(이론적으로 예상되는 개수) → 교차표에서 계산해서 확인
• 모든 칸의 기대빈도가 5 이상이 이상적
• 기대빈도 <5인 칸이 전체의 20% 이하면 사용 가능
• 기대빈도 조건 심하게 위배시 → Fisher's exact test 사용 (주로 2×2 표)

 

(3) 비율검정
• 정규근사 조건 → np≥5 그리고 n(1-p)≥5 확인
• 조건 충족 → 정규근사 기반 z-test 사용
• 조건 미충족 → 이항분포 기반 정확검정 사용(4) F검정 (두 그룹의 분산 비교)
• 정규성 확인 → Shapiro-Wilk test로 확인 (p>0.05면 정규분포)
• 정규분포라면 → F검정 진행
• 정규성 가정이 의심스러우면 → Levene's test 사용 (정규성에 덜 민감한 대안)

비지니스 실무에서 통계 검정은 의사결정을 위한 도구이지 완벽한 수학이 목적이 아닙니다!
"완벽한 조건 충족"보다 "충분히 괜찮은 수준"이라면 진행하세요.

 


• 정규성 p=0.048 → 0.05에 매우 가까우니 모수 검정 진행
• 기대빈도 4.8 → 5에 매우 가까우니 카이제곱 진행
• 애매하면 → 모수/비모수 둘 다 실행해서 결과 일관성 확인
  - 결과가 비슷하면 → 모수 검정 결과 사용 (해석 쉬움)
  - 결과가 다르면 → 비모수 검정 결과 사용 (더 안전)
• 결과 보고시 → 가정 충족 상황을 투명하게 공유
  - 항상 정직하게: 완벽하지 않은 부분이 있다면 명시하되, 결론의 타당성도 함께 설명
  - 예:  "정규성 검정 p=0.048로 경계선상이나, 비모수 검정에서도 동일한 결과 확인"

 

실제 예시로 보는 의사결정:
상황 1: "이번 달 매출이 저번 달보다 늘었나?"
1. 목적: 평균 매출 차이 검정
2. 데이터: 일별 매출 (연속형)
3. 검정방법 → t검정!
4. n=30 → 정규성 확인 안 해도 됨
5. 바로 t검정 실행

 

상황 2: "여성이 남성보다 구매를 많이 하나?"
1. 목적: 성별과 구매 관계
2. 데이터: 성별(범주), 구매여부(범주)
3. 검정방법 → 카이제곱!
4. 정규성? 생각할 필요도 없음
5. 각 셀의 기대빈도가 5보다 큰지 확인하고 실행

 

상황 3: "3개 지점 매출 차이 있나?"
1. 목적: 여러 그룹 평균 비교
2. 데이터: 매출액 (연속형)
3. 검정방법 → ANOVA!
4. 각 그룹 n≥30 → 바로 실행

 

상황 4: "광고 A의 클릭률이 광고 B보다 높은가?"
1. 목적: 두 그룹 비율 차이 검정
2. 데이터: 클릭여부 (클릭/미클릭), 클릭률 3% vs 5%
3. 검정방법 → 비율검정!
4. 정규근사 조건 확인: n×p = 1000×0.03 = 30 (≥5 충족)
5. z-test로 비율 차이 검정 실행

 

상황 5: "A공장과 B공장 제품 품질이 균일한가?"
1. 목적: 두 그룹 분산(변동성) 비교
2. 데이터: 제품 불량률의 편차 (연속형)
3. 검정방법 → F검정!
4. 정규성 확인 필요 (F검정은 정규성에 민감)
5. 정규분포면 F검정, 아니면 Levene's test 실행

📌 가설검정 학습 조언
가설검정 종류가 너무 많아서 공부하기 힘들고 헷갈리실거에요.
실무 경험상 t검정(평균 비교)과 카이제곱검정(관계 분석) 이 두 가지만 제대로 알아도 실무의 상당 부분을 해결할 수 있습니다.

"A가 B보다 좋은가?"는 t검정으로, "A와 B가 관련 있는가?"는 카이제곱검정으로 답하면 되니까요.
먼저 이 둘을 확실히 익히고, 나머지 검정들(ANOVA, F검정, 비율 검정 등)은 필요할 때 하나씩 배워가세요.

감사합니다.