[표본조사론] 3. 층화임의추출법
by Rev_본 과목은 2학년 2학기 과목이며, 표본조사론에 대하여 배우는 수업이다.
표본조사론 | 이계오, 박진우, 이기재 지음 | 한국방송통신대학교출판문화원
교재는 위 교재를 사용하였다.
층화임의추출법
먼저 층화임의추출법(stratified random sampling)의 정의는 모집단을 먼저 서로 겹치지 않는 여러 개의 층으로 분할한 후, 각 층별로 단순임의추출법을 적용시켜 표본을 얻는 방법을 말한다.
층화를 이용하는 표본조사방법은 실제로 가장 널리 사용되는 기법 중 하나이다.
예를 들어 우리나라 사람들의 하루 평균 통근 시간을 구하고자 할 때, 이를 파악하기 위해서 서울과 지방에서 각각의 표본을 뽑아 조사한 후, 각각의 추정량을 서로 비교해야 할 것이다.
그렇게 하지 않으면 만일 뽑힌 표본이 지방에만 몰려있으면 과소 추정이 될 것이고, 표본이 서울에만 몰려 있으면 과대 추정이 될 수 있기 때문이다.
여기서 나누어진 부모집단을 층이라고 하고, 모집단을 층으로 나누는 과정을 층화라고 한다.
또한 층화 표집은 단순임의표집에 비하여 관리가 용이하며 비용이 절감되고, 층마다 다른 조사방법을 적용할 수 있다.
층화 변수
: 모집단에서 집단을 몇 개의 층으로 나누려고 할 때, 각 추출단위가 어느 층에 속하는지를 구분하는 기준으로 삼는 변수를 의미한다.
층화의 기준 변수는 모집단을 동질한 층으로 나누어서 층내 분산이 전체모집단의 분산에 비하여 낮아지게 하는데 이는 블록화의 개념과 유사함
- 층화변수 고려사항
1. 조사항목에서 가장 중심이 되는 항목과 관계가 깊은 특성을 기준
2. 양적인 특성에 대해서는 모집단의 분포가 편향된 것 또는 표준편차 또는 변동계수가 큰 것을 기준
3. 계수적인 것은 모집단에서 비율이 작은 것을 기준
4. 시간적인 안정성이 없는 특성은 기준변수로 고려 X
5. 일반적으로 성별, 연령, 학력, 지역, 종업원 수, 매출액, 주택유형, 주택면적, 직업 등이 층화변수로 널리 쓰임
- 예제
층화변수 결정 사례 : 어느 대학교 학생들의 주당 평균 학습시간 조사
층화변수는 학습시간과 밀접한 관련을 지니면서도 쉽게 구할 수 있는 변수를 선택해야할 것이다.
- 성별 : 남, 여
- 전공 : 인문계, 이공계, 예체능
- 학년 : 저학년(1-2학년), 고학년(3-4학년)
층의 수는 2 X 3 X 2 = 12개이다.
층의 총 개수를 기호로 L이라고 하는 듯하다.
층화의 이점
- 모집단 전체의 조사결과 뿐만 아니라 층별 결과도 필요한 경우 유용
- 조사를 실시할 때 조사관리의 편의상 모집단을 층으로 설정할 필요가 있는 경우(표본관리, 조사업무관리 편리성)
- 추정값 정도의 향상
모평균의 추정
'복수전공' 카테고리의 다른 글
[데이터시각화] 7. ggplot2 (0) | 2021.12.13 |
---|---|
[범주형 데이터분석] 5. 텍스트 분석(NLP) (0) | 2021.12.02 |
[현대사회의 데이터와 통계학] 5. Matplotlib로 그래프 그리기 (0) | 2021.11.10 |
[범주형 데이터분석] 4. 군집화(Clustering) (0) | 2021.11.05 |
[데이터 시각화] 6. ggplot2 (0) | 2021.11.04 |
블로그의 정보
Hi Rev
Rev_