統(tǒng)計(jì) - 分層抽樣

2018-12-28 10:08 更新

這種用于檢查的策略被用作環(huán)境的一部分,其中群體可以毫不費(fèi)力地分割成彼此特別不相同的集合或?qū)?,但是集合?nèi)部的組件對(duì)于幾個(gè)屬性是同類的。 G。 學(xué)校的學(xué)習(xí)可以在性取向,提供的課程,年齡等前提下分成階層。 在此,群體最初被分成層,之后從每個(gè)層取得基本的不規(guī)則標(biāo)本。 分層測(cè)試有兩種類型:成比例的分層檢查和不成比例的分層檢查。

  • 比例分層抽樣 - 在此,從每個(gè)層選擇的單位數(shù)量與層中的份額成比例。 在一所大學(xué)有2500名學(xué)生,其中1500名學(xué)生注冊(cè)研究生課程,1000名注冊(cè)研究生課程。 如果要使用成比例的分層抽樣來(lái)選擇樣本100,那么樣本中的本科生的數(shù)量將是60,并且40個(gè)是研究生。 因此,兩個(gè)層在樣本中以與它們?cè)谌后w中的表示相同的比例表示。

    當(dāng)抽樣的目的是估計(jì)一些特征的人口值,并且層內(nèi)方差沒有差異時(shí),這種方法是最合適的。

  • 不成比例的分層抽樣 - 當(dāng)研究的目的是比較各層之間的差異時(shí),就必須從所有層中抽取相等的單位,而不考慮它們?cè)谌丝谥械姆蓊~。 有時(shí),某些層相對(duì)于某些特征比其他層更可變,在這種情況下,可以從更可變的層中抽取更多數(shù)量的單元。 在這兩種情況下,抽取的樣本是不成比例的分層樣本。

    可以使用以下公式來(lái)最佳地分配層大小和層變異性的差異,以從不同層確定樣本大小

    $ {n_i = \\ frac {n.n_i \\ sigma_i} {n_1 \\ sigma_1 + n_2 \\ sigma_2 + ... + n_k \\ sigma_k} \\ for \\ i = 1,2 ... k} $

    其中 -

    • $ {n_i} $ = i strata的樣本大小。

    • $ {n} $ = strata的大小。

    • $ {\\ sigma_1} $ = i strata的標(biāo)準(zhǔn)偏差。

    除此之外,可能存在這樣的情況,其中收集樣品的成本可能在一個(gè)層次比在其他層次更多。 最佳不成比例抽樣應(yīng)該以這樣的方式進(jìn)行

    $ {\\ frac {n_1} {n_1 \\ sigma_1 \\ sqrt {c_1}} = \\ frac {n_2} {n_2 \\ sigma_1 \\ sqrt {c_2}} = ... = \\ frac {n_k} {n_k \\ sigma_k \\ sqrt { c_k}}} $

    其中$ {c_1,c_2,...,c_k} $指的是k層中的采樣成本。 來(lái)自不同層的樣本量可以使用以下公式確定:

    $ {n_i = \\ frac {\\ frac {n.n_i \\ sigma_i} {\\ sqrt {c_i}}} {\\ frac {n_1 \\ sigma_1} {\\ sqrt {c_i}} + \\ frac {n_2 \\ sigma_2} {\\ sqrt {c_2}} + ... + \\ frac {n_k \\ sigma_k} {\\ sqrt {c_k}}} for \\ i = 1,2 ... k} $

例子

問題陳述:

一個(gè)組織有5000名員工,分為三個(gè)層次。

  • A層:50名高管,標(biāo)準(zhǔn)差= 9

  • 階層B:1250個(gè)非手工工人,標(biāo)準(zhǔn)偏差= 4

  • 層C:3700個(gè)標(biāo)準(zhǔn)偏差= 1的人工

如何抽樣300名員工,在不合比例的基礎(chǔ)上進(jìn)行最佳配置?

解決方案:

使用不成比例抽樣的公式進(jìn)行最優(yōu)分配。

${n_i = \frac{n.n_i\sigma_i}{n_1\sigma_1+n_2\sigma_2+n_3\sigma_3}} \\[7pt] \, For Stream A, {n_1 = \frac{300(50)(9)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{135000}{1950} = {14.75}\ or\ say\ {15}} \\[7pt] \, For Stream B, {n_1 = \frac{300(1250)(4)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{150000}{1950} = {163.93}\ or\ say\ {167}} \\[7pt] \, For Stream C, {n_1 = \frac{300(3700)(1)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{110000}{1950} = {121.3}\ or\ say\ {121}}$

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)