抽樣與標準誤(Sampling and Standard Error) @ 以斯帖統計顧問公司

當我們想瞭解一個大群體(或稱母群體；a population)的資料特性，但礙於人力、經費與時間等現實因素，我們無法收集到母群體完整的資訊，於是會藉由抽取一部份的樣本以代表母群體，並利用抽樣結果描述母群體，而每次的抽樣結果與母裙體間的偏差即為標準誤(Standard Error)。它與標準差(Standard Deviation; SD)雖然只有一字之差，但意義完全不同。標準差為每個樣本與樣本平均值的偏差(Deviation)，用來描述一組樣本的分散情形。

以下的影片由英國心理學會(British Psychological Society; BPS) 募集資金製作的，希望透過舞蹈的趣味讓更多心理學系學生對統計觀念有更深刻的印象。

影片中穿藍衣的舞者代表母群體，他有自己的資料分佈特性，以藍色長方形表示他的資料形態(shape)，之後的每一個舞者代表每次的抽樣結果與資料分怖形態，不同次的抽樣結果亦有不同的資料形態以推估母群體。請大家注意每個樣本分佈的形態並與藍色的母群體做比較。

一個好的樣本估計會與母群體的資料形態很接近，然而，每一次的抽樣結果可能有不一樣的資料形態，此即我們所知的抽樣變異(sampling variation)，不同的抽樣結果產生不同的的母群體估計值。

當我們知道抽樣結果的不一致，將如何比較它與母群體的差異？如果抽樣結果與母群體的資料分佈差異很大，有較大的抽樣變異(sampling variation)，則是較差的樣本，然而我們以樣本估計母群體的特性時，也能有好的估計，一個較小的抽樣誤(Standard Error)代表了抽樣的結果能準確估計母群體。反之，較大的抽樣誤是不準確的抽樣估計。

我們利用抽樣方法去推估母群體，而不同的抽樣產生不同的估計值，稱為抽樣變異(sampling variation)，而抽樣誤差(Standard Error)告訴我們樣本估計的結果與母群體真值(true value)間的偏差程度。