2026/01 5

제1종 오류와 제2종 오류

제1종 오류와 제2종 오류가설검정의 결론을 내릴 때, 우리는 신이 아니기에 항상 '실수'의 가능성을 안고 있습니다. 통계학에서는 이 실수를 로 구분합니다.한자 어원과 재판 예시를 통해 아주 쉽게 정리해 드릴게요.1. 한자 어원과 기본 정의두 오류의 핵심은 "귀무가설을 어떻게 처리했는가"에 있습니다.① 제1종 오류 (第1種 誤謬)의미: 귀무가설이 실제로 참인데도, 이를 잘못 기각(버림)하는 오류.별칭: (알파) 오류, 유의수준, 가짜 양성(False Positive).한자 풀이: * 오(誤): 그릇될 오 (사실과 다르게 함)류(謬): 그르칠 류 (잘못하여 일을 망침)비유: "멀쩡한 사람을 죄인으로 만드는 성급함"② 제2종 오류 (第2種 誤謬)의미: 귀무가설이 실제로 거짓인데도, 이를 기각하지 못하고 채택하..

가설검정 (假說檢定)

가설검정 (假說檢定) : 임시 설정을 칼로 베어 판정함가설검정이라는 용어 자체에 통계적 프로세스가 모두 녹아 있습니다.① 가설 (假說)가(假): 거짓 가 / 임시 가 (가짜, 혹은 임시로 세움)설(說): 말씀 설 / 달랠 설 (의견이나 주장)의미: "아직 증명되지 않은 임시적인 주장"을 뜻합니다.② 검정 (檢定)검(檢): 검사할 검 (조사하여 살핌)정(定): 정할 정 (결론을 내림)의미: "그 주장이 맞는지 틀린 지 검사하여 판정한다"는 뜻입니다.1. 두 가지 가설: 귀무가설 vs 대립가설통계학에서는 특이하게도 '내가 주장하고 싶은 것'을 바로 증명하지 않고, 반대 의견을 먼저 세워 그것을 무너뜨리는 방식을 씁니다.용어한자 및 의미데이터 분석에서의 역할귀무가설귀무(歸無): 무로 돌아감"차이가 없다", "..

표본오차 (標本誤差)와 신뢰구간 (信賴區間)

1. 표본오차 (標本誤差)우리가 전수조사를 하지 않는 이상, '모수'와 '통계량' 사이에는 차이가 생길 수밖에 없습니다.표본(標本): 본보기(표)가 되는 근본(본). 즉, 전체에서 뽑아낸 일부.오차(誤差): 어긋날(오) 차이(차). 계산이나 측정에서 실제 값과 차이가 나는 것.의미: 전체(모집단)가 아닌 일부(표본)만 조사했기 때문에 발생하는 숙명적인 차이입니다.예를 들어, 전 국민의 실제 평균 키가 (모수)인데, 내가 뽑은 100명의 평균이 (통계량)라면 그 차이인 가 바로 표본오차입니다.2. 신뢰구간 (信賴區間)표본오차 때문에 우리는 "모수는 딱 얼마다!"라고 단정 지을 수 없습니다. 대신 "아마 이 범위 안에 있을 거야"라고 말하게 되는데, 이것이 신뢰구간입니다.신뢰(信賴): 믿을(신) 의지할(뢰)..

통계학에서 모수(母數)

1. 모수 (母數)의 어원 풀이한자를 알면 이 개념이 왜 '전체'를 의미하는지 바로 이해할 수 있습니다.모(母): 어머니 모수(數): 셀 수 / 수 수의미: 데이터의 어머니가 되는 수입니다.우리가 조사하고자 하는 대상 전체(모집단)가 가지고 있는 '변하지 않는 고유한 특성치'를 의미합니다. 어머니가 자식을 낳듯, 우리가 실제로 마주하는 데이터(표본)들은 바로 이 '모수'라는 본체로부터 추출되어 나옵니다.2. 왜 모수가 중요한가?우리가 알고 싶은 진짜 정보는 보통 모집단의 정보입니다. 하지만 현실적으로 대한민국 모든 성인의 평균 키를 직접 다 재는 것은 불가능하죠.모집단(Population): 관심 대상인 전체 집단 (예: 대한민국 전체 성인)모수(Parameter): 모집단의 특성치 (예: 대한민국 성인..

[빅데이터분석기사] 기술통계 (記述統計)

1. 기술통계 (記述統計)의 어원 풀이'기술통계'에서 '기술'은 테크닉(Technology)이 아니라, 기록하여 서술한다는 뜻을 담고 있습니다.① 기술 (記述)기(記): 기록할 기 (자기 생각을 적거나 사실을 기록함)술(述): 차례대로 말할 술 (어떤 사실을 순서대로 풀어서 설명함)의미: 있는 그대로의 사실을 가감 없이 기록하고 묘사한다는 뜻입니다. 즉, 수집한 데이터의 특성을 있는 그대로 요약하여 보여주는 것이 핵심입니다.② 통계 (統計)통(統): 거느릴 통 / 합칠 통 (흩어진 것을 하나로 묶음)계(計): 셀 계 (수량을 계산함)의미: 여러 데이터를 하나로 통합하여 수치로 계산한다는 뜻입니다.2. 기술통계의 핵심 개념기술통계는 크게 두 가지 관점에서 데이터를 묘사합니다. 빅데이터분석기사 시험에서도 이..