노년도 할수있다/한자와 함께하는 데이터과학

[빅데이터분석기사] 기술통계 (記述統計)

forSilver 2026. 1. 27. 11:56
반응형

 

1. 기술통계 (記述統計)의 어원 풀이

'기술통계'에서 '기술'은 테크닉(Technology)이 아니라, 기록하여 서술한다는 뜻을 담고 있습니다.

① 기술 (記述)

  • 기(記): 기록할 기 (자기 생각을 적거나 사실을 기록함)
  • 술(述): 차례대로 말할 술 (어떤 사실을 순서대로 풀어서 설명함)

의미: 있는 그대로의 사실을 가감 없이 기록하고 묘사한다는 뜻입니다. 즉, 수집한 데이터의 특성을 있는 그대로 요약하여 보여주는 것이 핵심입니다.

② 통계 (統計)

  • 통(統): 거느릴 통 / 합칠 통 (흩어진 것을 하나로 묶음)
  • 계(計): 셀 계 (수량을 계산함)

의미: 여러 데이터를 하나로 통합하여 수치로 계산한다는 뜻입니다.


2. 기술통계의 핵심 개념

기술통계는 크게 두 가지 관점에서 데이터를 묘사합니다. 빅데이터분석기사 시험에서도 이 두 범주를 구분하는 것이 매우 중요합니다.

A. 집중경향치 (Central Tendency)

데이터가 어느 위치(중심)에 모여 있는가를 나타냅니다.

  • 평균(Mean): 모든 값을 다 더해 개수로 나눈 값.
  • 중앙값(Median): 크기 순으로 세웠을 때 정중앙에 위치한 값.
  • 최빈값(Mode): 가장 빈번하게 나타나는 값.

B. 산포도 (Dispersion)

데이터가 얼마나 퍼져 있는가를 나타냅니다.

  • 분산(Variance): 평균에서 데이터가 떨어진 정도를 제곱하여 평균 낸 값.
  • 표준편차(Standard Deviation): 분산에 루트를 씌워 원래 단위로 맞춘 값.
  • 범위(Range): 최댓값과 최솟값의 차이.

3. 기술통계 vs 추론통계 (推論統計)

자격증 시험에서는 이 둘을 비교하는 문제가 자주 나옵니다.

구분 기술통계 (記述) 추론통계 (推論)
목적 현재 가진 데이터의 특성을 요약/묘사 표본을 통해 모집단의 특성을 예측
한자 의미 기록하여 서술함 미루어 짐작하여 논함
주요 도구 평균, 표준편차, 그래프(히스토그램) 가설검정, P-value, 회귀분석

정리하자면:
기술통계는 데이터라는 거울을 통해 현재 상태를 똑똑히 보는 것이고, 추론통계는 그 거울의 일부 조각을 보고 전체 모습이 어떨지 추측하는 것입니다.


4. 학습 팁

빅데이터분석기사 필기 시험에서는 왜곡된 분포(Skewness)와 기술통계치의 관계를 묻는 문제가 자주 나옵니다.

  • 정의적 왜도(오른쪽 꼬리): 평균 > 중앙값 > 최빈값
  • 부의적 왜도(왼쪽 꼬리): 최빈값 > 중앙값 > 평균

이 관계를 이해할 때도 "데이터가 어디로 쏠려(기) 기술(술)되는가"를 생각하시면 쉽습니다.