Statistics 3

평균, 분산, 표준편차

평균(mean, average) 어떤 집단을 대표하는 값 중의 하나로, 모든 원소의 값을 다 더한 후 원소의 개수로 나누어주는 값으로 정의됩니다. 분산(Variance) 분산도 평균의 일종으로, 편차를 제곱한 후 이들을 모두 더한 뒤 원소의 개수로 나누어주는 값으로 정의됩니다. 즉, "편차의 제곱의 평균"이 된다. 편차는 "원소의 값 - 평균"으로 각각의 원소값이 평균으로부터 얼마나 떨어져 있는지를 나타냅니다. 표준편차(Standard deviation) 표준편차는 분산을 제곱근한 값이 됩니다. 편차를 모두 더하면 0이 되기 때문에, 분산은 제곱을 한 후 평균을 구하게 됩니다. 제곱을 했으니, 다시 원래 스케일로 돌리기 위해서 제곱근을 해주게 됩니다. 예제 어떤 두 그룹 A,B가 있고, 각각 10명의 키..

Statistics 2023.07.15

모집단과 표본집단

모집단(population) 여론조사나 인구 조사를 할 때, 대상이 되는 모든 사람에 대해서 조사를 하면 제일 정확할 것입니다. 하지만 물리적, 시간적으로 그렇게 하지 못하는 경우가 많습니다. 예를 들어, "대한민국 사람들의 평균 키"에 대해서 조사를 해보고 싶다고 합시다. 그러면 대한민국 전체 사람들의 키를 조사해야하는데 이것은 불가능에 가깝습니다. 위 예제에서 모집단은 무엇이 될까요? 바로 "대한민국 전체 사람"이 될 것입니다. 즉, 연구자가 알고싶어하는 대상 전체를 가리켜서 "모집단"이라고 합니다. 다른 예로, A고등학교의 대학 진학률을 조사해보고 싶다고 하면, "A고등학교의 고3 학생 수"가 모집단이 될 것입니다. 다른 학교가 포함되면 안 되겠지요? 연구자는 "A고등학교"로 한정해서 진학률을 알고..

Statistics 2023.07.15

기술통계와 추리통계

기술통계(Descriptive Statistics) 어떤 대상이나 내용을 설명할 때 "기술한다"라고 합니다. 연구자가 모은 데이터에 대해 통계적으로 어떤 특성을 가지고 있는지 설명할 때 사용하는 통계이론이라고 할 수 있습니다. 여론 조사를 예를 들면, 대한민국 전체 인구를 대상으로 조사를 할 수는 없을 것입니다. 그래서 보통은 일부 집단을 선정하고 조사를 한 다음 결과를 발표합니다. 이때, 일부 집단은 어떻게 선정을 할까요? 어떤 기준에 의해서 선정되었다고 가정합시다. 그렇다면 선정된 집단이 과연 전체 집단의 특성을 대표한다고 할 수 있을까요? 이런 질문에 타당한 근거를 제시하기 위해서는 선정된 집단의 특성을 통계적으로 분석할 필요가 있습니다. 가장 쉽게 접할 수 있는 것이 "분포"입니다. 여론 조사를 ..

Statistics 2023.07.11