반응형
1. 기술통계 (記述統計)의 어원 풀이
'기술통계'에서 '기술'은 테크닉(Technology)이 아니라, 기록하여 서술한다는 뜻을 담고 있습니다.
① 기술 (記述)
- 기(記): 기록할 기 (자기 생각을 적거나 사실을 기록함)
- 술(述): 차례대로 말할 술 (어떤 사실을 순서대로 풀어서 설명함)
의미: 있는 그대로의 사실을 가감 없이 기록하고 묘사한다는 뜻입니다. 즉, 수집한 데이터의 특성을 있는 그대로 요약하여 보여주는 것이 핵심입니다.
② 통계 (統計)
- 통(統): 거느릴 통 / 합칠 통 (흩어진 것을 하나로 묶음)
- 계(計): 셀 계 (수량을 계산함)
의미: 여러 데이터를 하나로 통합하여 수치로 계산한다는 뜻입니다.
2. 기술통계의 핵심 개념
기술통계는 크게 두 가지 관점에서 데이터를 묘사합니다. 빅데이터분석기사 시험에서도 이 두 범주를 구분하는 것이 매우 중요합니다.
A. 집중경향치 (Central Tendency)
데이터가 어느 위치(중심)에 모여 있는가를 나타냅니다.
- 평균(Mean): 모든 값을 다 더해 개수로 나눈 값.
- 중앙값(Median): 크기 순으로 세웠을 때 정중앙에 위치한 값.
- 최빈값(Mode): 가장 빈번하게 나타나는 값.
B. 산포도 (Dispersion)
데이터가 얼마나 퍼져 있는가를 나타냅니다.
- 분산(Variance): 평균에서 데이터가 떨어진 정도를 제곱하여 평균 낸 값.
- 표준편차(Standard Deviation): 분산에 루트를 씌워 원래 단위로 맞춘 값.
- 범위(Range): 최댓값과 최솟값의 차이.
3. 기술통계 vs 추론통계 (推論統計)
자격증 시험에서는 이 둘을 비교하는 문제가 자주 나옵니다.
| 구분 | 기술통계 (記述) | 추론통계 (推論) |
|---|---|---|
| 목적 | 현재 가진 데이터의 특성을 요약/묘사 | 표본을 통해 모집단의 특성을 예측 |
| 한자 의미 | 기록하여 서술함 | 미루어 짐작하여 논함 |
| 주요 도구 | 평균, 표준편차, 그래프(히스토그램) | 가설검정, P-value, 회귀분석 |
정리하자면:
기술통계는 데이터라는 거울을 통해 현재 상태를 똑똑히 보는 것이고, 추론통계는 그 거울의 일부 조각을 보고 전체 모습이 어떨지 추측하는 것입니다.
4. 학습 팁
빅데이터분석기사 필기 시험에서는 왜곡된 분포(Skewness)와 기술통계치의 관계를 묻는 문제가 자주 나옵니다.
- 정의적 왜도(오른쪽 꼬리): 평균 > 중앙값 > 최빈값
- 부의적 왜도(왼쪽 꼬리): 최빈값 > 중앙값 > 평균
이 관계를 이해할 때도 "데이터가 어디로 쏠려(기) 기술(술)되는가"를 생각하시면 쉽습니다.
'노년도 할수있다 > 한자와 함께하는 데이터과학' 카테고리의 다른 글
| 제1종 오류와 제2종 오류 (0) | 2026.01.31 |
|---|---|
| 가설검정 (假說檢定) (0) | 2026.01.30 |
| 표본오차 (標本誤差)와 신뢰구간 (信賴區間) (0) | 2026.01.29 |
| 통계학에서 모수(母數) (0) | 2026.01.28 |