IT Log

05. 모집단과 표본(Population and Sample) 본문

Statistics/통계(Statistics)

05. 모집단과 표본(Population and Sample)

newly0513 2020. 8. 18. 20:36
728x90
반응형

1. 모집단과 표본

모집단

 관심의 대상이 되거나 조사의 대상이 되는 모든 개체 값의 집합을 말합니다. 모집단은 모집단을 구성하는 개체의 수가 유한한 유한 모집단과 모집단을 구성하는 개체의 수가 무한한 무한 모집단이 있습니다.

 

모수

 모집단의 특성치로 모집단 분포 특성을 규정짓는 척도입니다. 모평균, 모분산, 모비율, 모표준편차 등이 모수로 통상 모수는 알려져 있지 않아 모집단에서 추출한 표본 특성을 분석하여 모수에 대해 추측, 추론합니다.

 

표본

 모집단에서 추출된 조사 대상이며, 추출된 자료의 개수를 표본의 크기라고 합니다.

 

전수조사

 대상이 되는 자료 전체를 조사하는 것으로, 전수조사를 통해 모집단의 평균과 표준편차를 구합니다.

 

표본조사

 대상이 되는 자료의 일부만을 추출하여 조사하는 것으로, 표본의 평균과 표준편차를 구합니다.

 

 일반적으로 전수 조사를 통해 모집단의 평균과 표준편차를 얻는 것은 현실적으로 비용과 시간이 많이 들기 때문에 비용과 시간을 절약하기 위해 표본조사를 통한 표본(Sample)을 추출하여 모집단의 평균과 표준편차를 추정하게 됩니다. 


2. 모평균과 표본평균

모평균 / 모분산 / 모표준편차

 

표본평균 / 표본분산 / 표본표준편차

 

※ 표본분산이나 표본표준편차를 n-1로 나누는 이유

 첫번째로는 표본분산의 기댓값을 구할 때 n-1로 나눠야 모분산으로 표현됩니다.

 

두번째로는 '표본 자료 중 모집단에 대한 정보를 주는 독립적인 표본 자료의 수'인 자유도에 의해서 편차의 총합은 0이 되므로 n-1개만으로도 나머지 1개의 값을 알 수 있기 때문에 자유도가 n-1이 됩니다.  예를 들어 표본 {1, 2, 3, 4, 5}의 평균은 3이고, 편차의 값은 {-2, -1, 0, 1, 2}가 되고 편차의 합은 0인걸 확인할 수 있습니다. 그렇다면 전체 편차에서 한 개의 편차 값이 없더라도 4개의 편차 값만으로도 나머지 하나의 편차 값을 알 수 있기 때문에 n-1이 됩니다.

 

표본평균의 평균 / 분산 / 표준편차

 

표본평균의 분포 

모집단의 분포가 정규분포이거나 모집단의 분포가 정규분포가 아닐 때에도 n이 충분히 크면, 표본평균의 분포는 근사적으로 아래의 정규분포를 따릅니다. (∵ n≥30)

 

모집단, 표본집단, 표본평균집단의 관계

 모집단의 모수(평균, 분산, 표준편차)를 모른다는 가정하에 

  1. 모표준편차와 표본표준편차는 거의 같다. ( σ ≈ S )
  2. 모평균과 표본평균의 평균은 같다. ( μ = m )

 

728x90
반응형
Comments