Statistics

모집단과 표본집단

voidtype 2023. 7. 15. 21:05

모집단(population)

여론조사나 인구 조사를 할 때, 대상이 되는 모든 사람에 대해서 조사를 하면 제일 정확할 것입니다. 하지만 물리적, 시간적으로 그렇게 하지 못하는 경우가 많습니다.

 

예를 들어, "대한민국 사람들의 평균 키"에 대해서 조사를 해보고 싶다고 합시다. 그러면 대한민국 전체 사람들의 키를 조사해야하는데 이것은 불가능에 가깝습니다. 위 예제에서 모집단은 무엇이 될까요? 바로 "대한민국 전체 사람"이 될 것입니다.

 

즉, 연구자가 알고싶어하는 대상 전체를 가리켜서 "모집단"이라고 합니다. 다른 예로, A고등학교의 대학 진학률을 조사해보고 싶다고 하면, "A고등학교의 고3 학생 수"가 모집단이 될 것입니다. 다른 학교가 포함되면 안 되겠지요? 연구자는 "A고등학교"로 한정해서 진학률을 알고 싶어 했으니까요.

표본 집단(sample)

표본집단을 "샘플"이라고 합니다. 샘플의 정의는 아시다시피 전체가 아닌 일부분이라는 뜻을 가지고 있습니다. 화장품 가게에서 나눠주는 샘플도 같은 의미입니다.

 

모집단 전체에 대해서 조사를 할 수 없으니, 일부분 추출하여 표본집단으로 선정하고 이 집단을 대상으로 조사를 하게 됩니다. 그리고 이후에, 모집단에 대해서 이렇게 될 것이다라고 결론을 내리게 됩니다.

 

정리하자면, 연구자가 알고 싶어 하는 모집단의 양상을 추정하기 위해 실제로 조사를 하게 되는 집단이라고 할 수 있습니다. 직관적으로 인구 관련 조사라면 지역이나 연령등의 분포를 따져서 표본집단이 모집단을 편향되지 않고 대표성을 가질 수 있게 만드는 것이 중요해 보입니다.