1、簡(jiǎn)單隨機(jī)抽樣
有放回簡(jiǎn)單隨機(jī)抽樣從總體中隨機(jī)抽出一個(gè)樣本單位,記錄觀測(cè)結(jié)果后,將其放回到總體中去,再抽取第二個(gè),如此類推,一直到抽滿n個(gè)單位為止。
單位有被重復(fù)抽中的可能,容易造成信息重疊而影響估計(jì)的效率,較少采用。
2、不放回簡(jiǎn)單隨機(jī)抽樣
從包含N個(gè)單元的總體中逐個(gè)隨機(jī)抽取單元并無(wú)放回,每次都在所有尚未被抽入樣本的單元中等概率的抽取下一個(gè)單元,直到抽取n個(gè)單元為止。
每個(gè)單位最多只能被抽中一次,不會(huì)由于樣本單位被重復(fù)抽中而提供重疊信息,比放回抽樣有更低的抽樣誤差。
3、分層抽樣
先按照某種規(guī)則把總體分為不同的層,然后在不同的層內(nèi)獨(dú)立、隨機(jī)的抽取樣本,這樣所得到的樣本稱為分層樣本。如果每層中的抽樣都是簡(jiǎn)單隨機(jī)抽樣,則稱為分層隨機(jī)抽樣。
4、系統(tǒng)抽樣
系統(tǒng)抽樣指先將總體中的所有單元按一定順序排列,在規(guī)定范圍內(nèi)隨機(jī)抽取一個(gè)初始單元,然后按事先規(guī)定的規(guī)則抽取其他樣本單元。最簡(jiǎn)單的系統(tǒng)抽樣是等距抽樣。
5、整群抽樣
整群抽樣是將總體中所有的基本單位按照一定規(guī)則劃分為互不重疊的群,抽樣時(shí)直接抽取群,對(duì)抽中的群調(diào)查其全部的基本單位,對(duì)沒(méi)有抽中的群則不進(jìn)行調(diào)查。
擴(kuò)展資料
概率抽樣包括以下幾個(gè)方面的優(yōu)點(diǎn):調(diào)查者可獲得被抽取的不同年齡、不同層次的人們的信息; 能估算出抽樣誤差; 調(diào)查結(jié)果可以用來(lái)推斷總體。
例如,在一項(xiàng)使用概率抽樣法的調(diào)查中,如果有 5 %的被訪者給出了某種特定回答,那么,調(diào)查者就可以以此百分比再結(jié)合抽樣誤差,推及總體情況。
另一方面,概率抽樣也有一些弊病:在大多數(shù)案例中,同樣規(guī)模的概率抽樣的費(fèi)用要比非概率抽樣高;概率抽樣比非概率抽樣需要更多時(shí)間策劃和實(shí)施;必須遵守的抽樣計(jì)劃執(zhí)行程序會(huì)大量增加收集資料的時(shí)間。
參考資料來(lái)源:百度百科-概率抽樣
1.簡(jiǎn)單隨機(jī)抽樣
若總體中每個(gè)個(gè)體被抽到的機(jī)會(huì)是均等的(即抽樣的隨機(jī)性),且在抽樣取走一個(gè)個(gè)體之后總體內(nèi)成分不變(即抽樣的獨(dú)立性),這種抽樣方式稱為簡(jiǎn)單隨機(jī)抽樣。
簡(jiǎn)單隨機(jī)抽樣一般用下述三種方法:
(1)抽簽法。把總體中的每一個(gè)個(gè)體都編上號(hào)碼,并做成簽,充分混合后從中隨機(jī)抽取一部分,這部分所對(duì)應(yīng)的個(gè)體就組成一個(gè)樣本。
(2)查表法。查隨機(jī)數(shù)表,確定從總體中所抽取個(gè)體的號(hào)碼,則號(hào)碼所對(duì)應(yīng)的個(gè)體就進(jìn)入樣本。隨機(jī)數(shù)表可隨意從任何一區(qū)、任何一個(gè)數(shù)目開(kāi)始,依次向各個(gè)方向順序進(jìn)行。
(3)計(jì)算機(jī)造數(shù)法。用電子計(jì)算機(jī)編造隨機(jī)數(shù)程序,把隨機(jī)數(shù)作為總體中抽出個(gè)體進(jìn)入樣本的號(hào)碼。
2.系統(tǒng)抽樣(等距抽樣)
系統(tǒng)抽樣方法實(shí)際上是等間隔法的機(jī)械抽樣。它把總體中所有個(gè)體按一定順序編號(hào),然后依固定間隔取樣,間隔的大小視所需樣本容量與總體中個(gè)體數(shù)目的比率而定,起始數(shù)字必須是隨機(jī)決定的。等距抽樣又有直線等距抽樣,對(duì)稱等距抽樣和循環(huán)等距抽樣三種。這種方法與簡(jiǎn)單隨機(jī)抽樣相比,方便、易學(xué)、易做,當(dāng)總體按一定順序排定后,第一個(gè)樣本一經(jīng)確定,其他樣本也隨之確定。但是,這種抽樣方法在名單排列中,如果存在周期性部分,則會(huì)造成偏差。因此,在等距抽樣間距確定以后,選擇起點(diǎn)時(shí),應(yīng)根據(jù)掌握的信息,盡量避開(kāi)總體可能存在周期的點(diǎn)。
3.分層抽樣(類型抽樣)分層抽樣是先把總體按一定標(biāo)志分成不同類型或?qū)哟?,然后從各種不同類型中隨機(jī)抽取若干單位組成樣本。
分層抽樣在各層中抽取的樣本也可看成總的樣本數(shù)在各層的分?jǐn)?,它又有三種方法:
(1)等比例抽樣。即各層所抽樣本數(shù)占各層總體單位數(shù)的比例相等。
(2)按各層的離散情況分配樣本。某層的離散程度大,則該層多分?jǐn)傄恍颖尽?/p>
(3)最優(yōu)分配。既考慮到各層的單位數(shù)的多少,又考慮到各層的離散情況。
4.整群抽樣
整群抽樣是先將各單位劃分為若干群(組),然后以群為單位從中隨機(jī)抽取一些群,對(duì)抽中的群的所有單位進(jìn)行調(diào)查。
概率抽樣包括有簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣(等距抽樣)、分層抽樣(類型抽樣)、整群抽樣、多段抽樣、PPS抽樣和戶內(nèi)抽樣。
例如: 簡(jiǎn)單隨機(jī)抽樣是一種廣為使用的概率抽樣方法。是最完全的概率抽樣。
如前面提到的,隨機(jī)抽樣就是總體中每個(gè)單位在抽選時(shí)有相等的被抽中的機(jī)會(huì)。在簡(jiǎn)單隨機(jī)抽樣條件下,抽樣概率公式為:抽樣概率=樣本單位數(shù)∕總體單位數(shù)例如,如果總體單位數(shù)為 10000 ,樣本單位數(shù)為 400 ,那么抽樣概率為 4 %。
簡(jiǎn)單隨機(jī)抽樣的優(yōu)點(diǎn)在于,它看起來(lái)簡(jiǎn)單,并且滿足概率抽樣的一切必要的要求,保證每個(gè)總體單位在抽選時(shí)都有相等的被抽中的機(jī)會(huì)。簡(jiǎn)單隨機(jī)抽樣可以通過(guò)電話隨機(jī)撥號(hào)功能完成這個(gè)步驟,可以從電腦檔案中挑選調(diào)查對(duì)象。
同樣,簡(jiǎn)單隨機(jī)抽樣會(huì)遇到“樣本可能分布不均勻”以及“沒(méi)有好的抽樣框”等問(wèn)題。友邦顧問(wèn)在簡(jiǎn)單隨機(jī)抽樣過(guò)程中常使用的技巧為“抽簽法”和“隨機(jī)表”法。
在定量抽樣調(diào)查中,等距抽樣常常代替簡(jiǎn)單隨機(jī)抽樣。由于該抽樣方法簡(jiǎn)單實(shí)用,所以應(yīng)用普遍。
等距抽樣得到的樣本幾乎與簡(jiǎn)單隨機(jī)抽樣得到的樣本是相同的。等距抽樣的基本做法是,將總體中的各單元先按一定的順序排列、編號(hào),然后決定一個(gè)間隔,并在此間隔基礎(chǔ)上選擇被調(diào)查的單位個(gè)體。
樣本距離可通過(guò)下面公式確定:樣本距離 =總體單位數(shù)∕樣本單位數(shù)例如,假設(shè)你使用本地電話本并確定樣本距離為 100 ,那么 100 個(gè)中取 1 個(gè)組成樣本。這個(gè)公式保證了整個(gè)列表的完整性。
等距抽樣方式隨意用一個(gè)起點(diǎn),例如,如果你把一本電話本作為抽樣框,必須隨意取出一個(gè)號(hào)碼決定從該頁(yè)開(kāi)始翻閱。假設(shè)從第 5 頁(yè)開(kāi)始,在該頁(yè)上再另選一個(gè)數(shù)決定從該行開(kāi)始。
假定選擇從第 3 行開(kāi)始,這就決定了實(shí)際開(kāi)始的位置。等距抽樣方式相對(duì)于簡(jiǎn)單隨機(jī)抽樣方式最主要的優(yōu)勢(shì)就是經(jīng)濟(jì)性。
等距抽樣方式比簡(jiǎn)單隨機(jī)抽樣更為簡(jiǎn)單,花的時(shí)間更少,并且花費(fèi)也少。使用等距抽樣方式最大的缺陷在于總體單位的排列上。
一些總體單位數(shù)可能包含隱蔽的形態(tài)或者是“不合格樣本”,調(diào)查者可能疏忽,把它們抽選為樣本。 定量調(diào)查中的分層抽樣是一種卓越的概率抽樣方式,在友邦公司以往的調(diào)查中經(jīng)常被使用。
分層抽樣的具體程序是:把總體各單位分成兩個(gè)或兩個(gè)以上的相互獨(dú)立的完全的組(如男性和女性),從兩個(gè)或兩個(gè)以上的組中進(jìn)行簡(jiǎn)單隨機(jī)抽樣,樣本相互獨(dú)立??傮w各單位按主要標(biāo)志加以分組,分組的標(biāo)志與我們關(guān)心的總體特征相關(guān)。
例如,我們正在進(jìn)行有關(guān)啤酒品牌知名度方面的調(diào)查,初步判別,在啤酒方面男性的知識(shí)與和女性不相同,那么性別應(yīng)是劃分層次的適當(dāng)標(biāo)志。如果不以這種方式進(jìn)行分層抽樣,分層抽樣就得不到什么效果,花再多時(shí)間、精力和物資也是白費(fèi)。
分層抽樣與簡(jiǎn)單隨機(jī)抽樣相比,我們往往選擇分層抽樣,因?yàn)樗酗@著的潛在統(tǒng)計(jì)效果。也就是說(shuō),如果我們從相同的總體中抽取兩個(gè)樣本,一個(gè)是分層樣本,另一個(gè)是簡(jiǎn)單隨機(jī)抽樣樣本,那么相對(duì)來(lái)說(shuō),分層樣本的誤差更小些。
另一方面,如果目標(biāo)是獲得一個(gè)確定的抽樣誤差水平,那么更小的分層樣本將達(dá)到這一目標(biāo)。在調(diào)查實(shí)踐中,為提高分層樣本的精確度實(shí)際上要付出一些代價(jià)。
通常,我們現(xiàn)實(shí)正確的分層抽樣一般有三個(gè)步驟:首先,辯明突出的(重要的)人口統(tǒng)計(jì)特征和分類特征,這些特征與所研究的行為相關(guān)。例如,研究某種產(chǎn)品的消費(fèi)率時(shí),按常理認(rèn)為男性和女性有不同的平均消費(fèi)比率。
為了把性別作為有意義的分層標(biāo)志,調(diào)查者肯定能夠拿出資料證明男性與女性的消費(fèi)水平明顯不同。用這種方式可識(shí)別出各種不同的顯著特征。
調(diào)查表明,一般來(lái)說(shuō),識(shí)別出 6 個(gè)重要的顯著特征后,再增加顯著特征的辨別對(duì)于提高樣本代表性就沒(méi)有多大幫助了。第二,確定在每個(gè)層次上總體的比例(如性別已被確定為一個(gè)顯著的特征,那么總體中男性占多少比例,女性占多少比例呢?)。
利用這個(gè)比例,可計(jì)算出樣本中每組(層)應(yīng)調(diào)查的人數(shù)。最后,調(diào)查者必須從每層中抽取獨(dú)立簡(jiǎn)單隨機(jī)樣本。
以上各種抽樣類型全部是按單位抽取的,即按樣本單位數(shù),分別一個(gè)單位一個(gè)單位地抽取。在整群抽樣中,樣本是一組單位一組單位地抽取。
整群抽樣有兩個(gè)關(guān)鍵步驟:-同質(zhì)總體被分為相互獨(dú)立的完全的較小子集。-隨機(jī)抽選子集構(gòu)成樣本。
如果調(diào)查者在抽中的子集中觀察全部單位,我們就有了一級(jí)整群樣本。如果在抽中的子集中再以概率方式抽取部分單位觀察,我們就有了二級(jí)整群樣本。
分層和整群抽樣都要將總體分為相互獨(dú)立的完全子集。它們的區(qū)別是,分層抽樣的樣本是從每個(gè)子集中抽取,而整群抽樣則是抽取部分子集。
地理區(qū)域抽樣是整群抽樣的典型方式。挨門挨戶去調(diào)查一個(gè)特定城市的調(diào)查者也許會(huì)隨機(jī)抽選一些區(qū)域,較集中地訪查一些群體,大量減少訪問(wèn)時(shí)間和經(jīng)費(fèi)。
整群抽樣被認(rèn)為是概率抽樣技術(shù),因?yàn)樗S機(jī)抽出群和隨機(jī)抽出單位。值得注意的是,在整群抽樣下,我們假定群中單位與總體一樣存在異質(zhì)性。
如果一群中單位的特征非常相似,如果由于共同環(huán)境使群內(nèi)差異小而群與群之間差異大。一般來(lái)說(shuō),要解決這個(gè)問(wèn)題可以擴(kuò)大群數(shù),然后從各群中抽取少量單位數(shù),以保證樣本。
概率抽樣方法 (Probability Sampling)
概率抽樣包括有
1. 簡(jiǎn)單隨機(jī)抽樣(又稱:?jiǎn)渭冸S機(jī)抽樣)
2. 系統(tǒng)抽樣(等距抽樣)
3. 分層隨機(jī)抽樣(類型抽樣)
4. 分群隨機(jī)抽樣
等方法。概率抽樣又稱幾率抽樣、可能率抽樣,在實(shí)踐中受到人們的普遍重視和廣泛應(yīng)用。概率抽樣是以概率論與數(shù)理統(tǒng)計(jì)為基礎(chǔ),首先按照隨機(jī)的原則選取調(diào)查樣本,使調(diào)查母體中每一個(gè)子體均有被選中的可能性,即具有同等被選為樣本的可能率,機(jī)遇均等。定量市場(chǎng)調(diào)查中的概率抽樣是指在調(diào)查總體樣本中的每個(gè)單位都具有同等可能性被抽中的機(jī)會(huì)。
概率抽樣的基本原則是:樣本量越大,抽樣誤差就越小,而樣本量越大,則成本就越高。根據(jù)數(shù)理統(tǒng)計(jì)規(guī)律,樣本量增加呈直線遞增的情況下(樣本量增加一倍,成本也增加一倍),而抽樣誤差只是樣本量相對(duì)增長(zhǎng)速度的平方根遞減。因此,樣本量的設(shè)計(jì)并不是越大越好,通常會(huì)受到經(jīng)濟(jì)條件的制約。
簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣(simple random sampling)又稱純隨機(jī)抽樣,是概率抽樣的最基本形式。
它是按等概率原則直接從含有N個(gè)元素的總體中隨機(jī)抽取n個(gè)元素組成樣本(N>n)。常用的辦法類似于抽簽,即把總體的每一個(gè)單位都編號(hào),將這些號(hào)碼寫在一張張小紙條上,然后放入一容器(如紙盒、口袋)中,攪拌均勻后,從中任意抽取,直到抽夠預(yù)定的樣本數(shù)目。
這樣,由抽中的號(hào)碼所代表的元素組成的就是一個(gè)簡(jiǎn)單隨機(jī)樣本。?比如,某系共有學(xué)生300人,系學(xué)生會(huì)打算采用簡(jiǎn)單隨機(jī)抽樣的辦法,從中抽取出60人進(jìn)行調(diào)查。
為了保證抽樣的科學(xué)性,他們先從系辦公室得到一份全系學(xué)生的名單,然后給名單中的每個(gè)學(xué)生都編上一個(gè)號(hào)(從001到300)。抽樣框編好后,他們又用300張小紙條分別寫上001,002,…,300。
他們把這300張寫好不同號(hào)碼的小紙條放在一個(gè)盒子里,攪亂后,隨便摸出60張小紙條。然后,他們按這60張小紙條上的號(hào)碼找到總體名單上所對(duì)應(yīng)的60位同學(xué)。
這60位同學(xué)就構(gòu)成了他們本次的樣本。這種方法簡(jiǎn)便易學(xué)。
但當(dāng)總體元素很多時(shí),寫號(hào)碼的工作量就很大,攪拌均勻也不容易,因而此法往往在總體元素較少時(shí)使用。對(duì)于總體元素很多的情形,我們則采用隨機(jī)數(shù)表來(lái)抽樣。
本書(shū)后就附有一張隨機(jī)數(shù)表,表中的數(shù)碼和排列都是隨機(jī)形成的,沒(méi)有任何規(guī)律性(故也稱為亂數(shù)表)。利用隨機(jī)數(shù)表進(jìn)行抽樣的具體步驟是:(1)先取得一份總體所有元素的名單(即抽樣框);(2)將總體中所有元素一一按順序編號(hào);(3)根據(jù)總體規(guī)模是幾位數(shù)來(lái)確定從隨機(jī)數(shù)表中選幾位數(shù)碼;(4)以總體的規(guī)模為標(biāo)準(zhǔn),對(duì)隨機(jī)數(shù)表中的數(shù)碼逐一進(jìn)行衡量并決定取舍;(5)根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個(gè)數(shù);(6)依據(jù)從隨機(jī)數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對(duì)應(yīng)的元素。
按上述步驟選擇出來(lái)的元素的集合,就是所需要的樣本。舉例來(lái)說(shuō),某總體共3 000人(四位數(shù)),需要從中抽取100人作為樣本進(jìn)行調(diào)查。
首先,我們要得到一份總體成員的名單;然后對(duì)總體中的每一個(gè)人從1到3 000進(jìn)行編號(hào);再根據(jù)總體的規(guī)模,確定從隨機(jī)數(shù)表中選擇四位數(shù)。具體的選法是從隨機(jī)數(shù)表的任意一行和任意一列的某一個(gè)四位數(shù)開(kāi)始,按照從上到下的順序,或者從左到右的順序,以3 000為標(biāo)準(zhǔn),對(duì)隨機(jī)數(shù)表中依次出現(xiàn)的每個(gè)四位數(shù)進(jìn)行取舍:凡小于或等于3 000的數(shù)碼就選出來(lái),凡大于3 000的數(shù)碼以及已經(jīng)選出的數(shù)碼則不要,直到選夠100個(gè)數(shù)碼為止;最后按照所抽取的數(shù)碼,從總體名單中找到它們所對(duì)應(yīng)的100個(gè)成員。
這100個(gè)成員就構(gòu)成一個(gè)隨機(jī)樣本。表6—2就是對(duì)3 000人的總體進(jìn)行抽樣時(shí),我們采用隨機(jī)數(shù)表對(duì)四位數(shù)碼進(jìn)行取舍的例子(采用后四位數(shù),并按從上往下的順序)。
表6—2隨機(jī)數(shù)表抽樣例隨機(jī)數(shù)表中的數(shù)碼選用的數(shù)碼不選用的原因后面四位數(shù)大于后面四位數(shù)大于30001359866042后面四位數(shù)大于3 與所選的第三個(gè)數(shù)碼重復(fù)27256511761176如果采用前四位數(shù)字,仍按從上往下的順序,那么從表6—2中我們又可以抽取出1 053、0 139、1 359、2 725這四個(gè)號(hào)碼;如果取中間的四位數(shù)字,所得到的則是2 990、1 404、1 912和0 582這四個(gè)號(hào)碼了。二、系統(tǒng)抽樣系統(tǒng)抽樣(systematic sampling)又稱等距抽樣或間隔抽樣。
它是把總體的單位進(jìn)行編號(hào)排序后,再計(jì)算出某種間隔,然后按這一固定的間隔抽取個(gè)體的號(hào)碼來(lái)組成樣本的方法。它和簡(jiǎn)單隨機(jī)抽樣一樣,需要有完整的抽樣框,樣本的抽取也是直接從總體中抽取個(gè)體,而無(wú)其他中間環(huán)節(jié)。
系統(tǒng)抽樣的具體步驟是:(1)給總體中的每一個(gè)個(gè)體按順序編號(hào),即制定出抽樣框。(2)計(jì)算出抽樣間距。
計(jì)算方法是用總體的規(guī)模除以樣本的規(guī)模。假設(shè)總體規(guī)模為N,樣本規(guī)模為n,那么抽樣間距K就由下列公式求得:K(抽樣間距)=N(總體規(guī)模)n(樣本規(guī)模)(3)在最前面的K個(gè)個(gè)體中,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取一個(gè)個(gè)體,記下這個(gè)個(gè)體的編號(hào)(假設(shè)所抽取的這個(gè)個(gè)體的編號(hào)為A),它稱做隨機(jī)的起點(diǎn)。
(4)在抽樣框中,自A開(kāi)始,每隔K個(gè)個(gè)體抽取一個(gè)個(gè)體,即所抽取個(gè)體的編號(hào)分別為A,A+K,A+2K,…,A+(n-1)K。(5)將這n個(gè)個(gè)體合起來(lái),就構(gòu)成了該總體的一個(gè)樣本。
例如,要在某大學(xué)總共3 000名學(xué)生中,抽取一個(gè)容量為100的大學(xué)生樣本。我們先將3 000名學(xué)生的名單依次編上號(hào)碼,然后按上述公式可求得抽樣間距為:K=3 000/100=30即每隔30人抽一名。
為此,我們先在1~30的數(shù)碼中,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取一個(gè)數(shù)字,假如抽到的是12,那么就以12為第一個(gè)號(hào)碼,每隔30名再抽一個(gè)。這樣,我們便可得到12,42,72,…,2 982總共100個(gè)號(hào)碼。
我們?cè)俑鶕?jù)這100個(gè)號(hào)碼,從總體名單中一一對(duì)應(yīng)地找出100名學(xué)生,這100名學(xué)生就構(gòu)成本次的一個(gè)樣本。從上面的過(guò)程中我們不難看出,系統(tǒng)抽樣較之于簡(jiǎn)單隨機(jī)抽樣來(lái)說(shuō),顯然簡(jiǎn)便易行多了,尤其是當(dāng)總體及樣本的規(guī)模都較大時(shí)更是如此。
這也正是社會(huì)研究較少采用簡(jiǎn)單隨機(jī)抽樣而較多采用系統(tǒng)抽樣的原因。值得注意的是。
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥(niǎo). 頁(yè)面生成時(shí)間:3.163秒