노년도 할수있다/한자와 함께하는 데이터과학

가설검정 (假說檢定)

forSilver 2026. 1. 30. 13:14
반응형

 

가설검정 (假說檢定) : 임시 설정을 칼로 베어 판정함

가설검정이라는 용어 자체에 통계적 프로세스가 모두 녹아 있습니다.

① 가설 (假說)

  • 가(假): 거짓 가 / 임시 가 (가짜, 혹은 임시로 세움)
  • 설(說): 말씀 설 / 달랠 설 (의견이나 주장)

의미: "아직 증명되지 않은 임시적인 주장"을 뜻합니다.

② 검정 (檢定)

  • 검(檢): 검사할 검 (조사하여 살핌)
  • 정(定): 정할 정 (결론을 내림)

의미: "그 주장이 맞는지 틀린 지 검사하여 판정한다"는 뜻입니다.


1. 두 가지 가설: 귀무가설 vs 대립가설

통계학에서는 특이하게도 '내가 주장하고 싶은 것'을 바로 증명하지 않고, 반대 의견을 먼저 세워 그것을 무너뜨리는 방식을 씁니다.

용어 한자 및 의미 데이터 분석에서의 역할
귀무가설 귀무(歸無): 무로 돌아감 "차이가 없다", "효과가 없다"는 원래의 상태. (기각시켜야 할 대상)
대립가설 대립(對立): 마주 서서 버팀 "차이가 있다", "효과가 있다"는 분석가의 새로운 주장.

2. 유의수준 (有意水準)과 P-value

가설을 검정할 때 '어느 정도나 확실해야' 결론을 내릴 수 있을까요? 이때 등장하는 기준이 유의수준입니다.

  • 유의(有意): 뜻이 있음 (우연이 아니라 어떤 의미나 원인이 있음)
  • 수준(水準): 물의 높이 (기준이 되는 높이)

P-value(유의확률): "귀무가설이 맞다는 전제하에, 현재 데이터와 같은 결과가 나올 확률"입니다.

  • P-value가 너무 작으면? (보통 0.05 미만): "이건 우연(귀무가설)으로 일어날 확률이 너무 낮아! 뭔가 의미(유의)가 있는 결과야!"라고 판단하여 귀무가설을 기각(Rejection)합니다.

3. 핵심 정리 (빅분기 빈출)

빅데이터분석기사 시험에서는 아래의 문장 구조를 이해하는 것이 핵심입니다.

  1. 귀무가설을 세운다: (예: 이 약은 효과가 없다.)
  2. 데이터를 통해 P-value를 구한다.
  3. 유의수준과 비교한다: (보통 0.05)
  4. 판정한다:
  • "귀무가설 기각, 대립가설 채택" (통계적으로 유의함)
  • "귀무가설 채택" (통계적으로 유의하지 않음)

기술통계로 데이터를 묘사하고, 모수를 추정하기 위해 신뢰구간을 설정하며, 마지막으로 가설검정을 통해 결론을 내리는 것이 통계 분석의 전체 흐름입니다.