之前曾介紹分層抽樣法在SAS程式中的應用(分層等比例抽樣法 ;分層不等比例抽樣法 ),此單元將對分層抽樣法作更深入的介紹。
分層抽樣(stratified sampling)屬於隨機抽樣法(Radom sampling)中的一種,其方法為將抽樣母體分成性質不同或互斥的若干組,每一組為一個『層』(strata),同層的性質要儘量相近,即變異要愈小愈好;不同層間的變異要愈大愈好,但分層組數不宜太多,可在6組以內(Cochran 1963)。選擇分層的變數通常與研究的主題有直接的關聯,例如依BMI(身體質量指數)的大小將肥胖程度分為過瘦(18以下)、標準(18-23.9)、輕微過重(24-26.9)以及過重(27以上)等。其他常用的變項如性別、年齡、社經地位、都市化程度等。
再從各層中隨機抽取樣本,此法可依適用情形再分為等比例抽樣以及不等比例抽樣。等比例抽樣(或稱分層固定比例)中,適用當各層樣本數與該層總體數的比值相等,而採取固定的比例抽樣。例如,樣本大小n=50,總體N=500,則n/N=0.1 即為樣本比例,每層均按這個比例確定該層樣本數,可避免各層抽過多或過少,並減少抽樣誤差,最常用的方法是「比例配置法」(Proportional allocation)。不等比例抽樣的適用情形為層內變異較大,則抽樣個數較多,反之則抽較少,常用方法為「尼曼配置法」(Neyman allocation),各層樣本數與該層總體數的比值並不固定。
採用分層抽樣法可避免出現簡單隨機抽樣中的集中於某些特性或遺漏掉某些特性的缺點,而其優點為可靠性高且利於比較。
要如何來決定每一層內抽出的樣本數呢?以下為各層樣本數的估計方法
1. 「尼曼配置法」範例
「尼曼配置法」主要是考慮各層變異不同,同時考慮各層所佔比例不同,所採取的估計方法。
例題 某大學欲了解其大學畢業生的起薪,採用分層隨機抽樣法,依學院別分成三層。各學院畢業生人數 Ni 及根據過去調查所求得這三學院的畢業生起薪之標準差Si (以月計) 分別列於表3。 (2012年地方特考,20分)
層別 (學院) |
商學院 |
文學院 |
法學院 |
起薪標準差 (萬元) |
S1=5 |
S2=6 |
S3=3 |
畢業生人數 (人數) |
N1=1000 |
N2=400 |
N3=600 |
若總共要抽出200個畢業生為樣本(N=200)
(一) 採用尼曼配置法 (Neyman allocation)各層應配置多大的樣本?
(二) 採用「比例配置法」(Proportional allocation)各層應配置多大的樣本?
解答:
n1=200×(1000/2000×5)/(1000/2000×5+400/2000×6+600/2000×3)≒109
n2=200×(400/2000×6)/(1000/2000×5+400/2000×6+600/2000×3)≒52
n3=200×(600/2000×5)/(1000/2000×5+400/2000×6+600/2000×3)≒39
2. 比例配置法(Proportional allocation)
若每一層的層內變異皆相同, ,則「尼曼配置法」的公式可簡化為 ,即各層所佔比例。
例題:同上
解答:
n1=200×(1000/2000)=100
n2=200×(400/2000)=40
n3=200×(600/2000)=60
留言列表