此文將延續之前的ROC曲線 (http://goo.gl/B9H0tg) 的介紹,進一步分享如何使用SigmaPlot軟體繪製ROC曲線。上一篇PO文介紹的操作軟體為SPSS,該軟體的限制主要為無法比較不同檢驗工具間的曲線下面積(AUC)之差異,有許多的統計軟體皆可達到此一分析目的,SigmaPlot即為其一,為何要介紹SigmaPlot呢?因為它的界面好操作,ROC曲線圖的呈現夠專業。estat 發表在 痞客邦 留言(0) 人氣(5,426)
站在敦化北路的高樓裡,眺望著玻璃窗外的遠山,以及反射在大樓玻璃的夕陽,一群聽了一天的『社會企業』課程的年輕人,即將要結束充實的學習之旅,並帶著自己的夢想繼續往前走。
estat 發表在 痞客邦 留言(0) 人氣(206)
地理醫學:結合個人健康與公共衛生
Geomedicine: Hooking Personal Health and Public Health
estat 發表在 痞客邦 留言(0) 人氣(398)
當我們想瞭解一個大群體(或稱母群體;a population)的資料特性,但礙於人力、經費與時間等現實因素,我們無法收集到母群體完整的資訊,於是會藉由抽取一部份的樣本以代表母群體,並利用抽樣結果描述母群體,而每次的抽樣結果與母裙體間的偏差即為標準誤(Standard Error)。它與標準差(Standard Deviation; SD)雖然只有一字之差,但意義完全不同。標準差為每個樣本與樣本平均值的偏差(Deviation),用來描述一組樣本的分散情形。
estat 發表在 痞客邦 留言(1) 人氣(28,832)
當兩個變項具有線性相關時,可將兩個變項的直線關聯性以一個直線型迴歸函數表示。常見的簡單線性迴歸模型中只有一個解釋變項,其模式可表示為Yi=a+bXi+ei (Yi為依變項、Xi為自變項/解釋變項、a為截距、b為迴歸係數、ei為殘差) ,其中研究者所收集到的資料爲(Yi, Xi) ,其主要的目的即爲以收集到的依變項及解釋變項的資料來估計出未知的參數a, b。estat 發表在 痞客邦 留言(2) 人氣(49,160)
estat 發表在 痞客邦 留言(0) 人氣(2,442)
estat 發表在 痞客邦 留言(0) 人氣(4,161)
首先在[程式一]建立10筆資料,包含no, age ,sex等變項。
[程式一]
data aa;
input no age sex $ ;
cards;
1 23 F
2 24 F
3 52 M
4 36 M
5 12 M
6 18 F
7 42 F
8 19 M
9 37 M
10 29 F
;
proc print;
run;
隨機抽樣的執行程序為surveyselect, 方法為simple random sampling (method = SRS),rep(Replicate) =1 , 為限定重覆抽取的次數為1次,若定為2,會再抽第2次。sampsize = 4 即隨機抽出4筆。seed = 12345中的seed係指定隨機抽樣起點,後面的12345的數字可以任意給予,每次給的數字若固定,抽出的樣本則固定,因此並非真正的隨機, 而是偽隨機(psudo-random),若不給定seed指令,每次抽出的樣本將不固定。
[程式二]
proc surveyselect data = aa method = SRS rep = 1
sampsize = 4 seed = 12345 out = bb;
id _all_; /*樣本取出後, 列出所有的欄位 */
run;
proc print data = bb noobs;
run;
Replicate no age sex
1 3 52 M
1 6 18 F
1 8 19 M
1 10 29 F
estat 發表在 痞客邦 留言(0) 人氣(1,720)
在健保資料中,若要看每年的承保人數、醫護人員數、慢性病盛行人數,若未留意這些資料在各年是不連貫的, 例如承保檔只存在加保與退保的記錄, 若無變更, 中間的各年間是不會有資料的;
在健保資料庫中定義了糖尿病的發生資料,若想看糖尿病的盛行趨勢, 若中間有未就醫的記錄, 例如就醫年份為1997,1998,2000,2001,2003,2004,2005,但1999與2002年未就醫,對於一旦確定是糖尿病的患者,若非死亡的因素,應該一直為疾病盛行人口, 但患者若有一段時間未就醫, 如何觀察盛行率的長期趨勢?
以下介紹簡單的補值, 程式中建立2筆資料, 資料的起迄年份為IN_YEAR, OUT_YEAR, 利用DO /END的迴圈,以及OUTPUT指令即可將中間各年的資料補上。
迴圈自IN_YEAR跑到OUT_YEAR, 迴圈每跑一圈, 年份自動加 1, 新產生的年份置入新變數YEAR中, 此時以OUTPUT將新的迴圈結果輸出, 一直遞迴至迴圈結束為止。 estat 發表在 痞客邦 留言(0) 人氣(1,559)
在許多臨床試驗中,由於針對某些疾病個案的收集不易(或是phase II trial ,僅收集較少的個案),所以造成後續可用來進行統計分析的樣本數不大,此時常見的分析方法爲無母數方法(non-parametric method)。針對數值型的反應變項(response),如欲比較實驗組和控制組間,反應值是否有差異,Mann-Whitney U test爲最常用的分析方法。然而,當反應值的分佈狀況並非聚集於中央,而是群集於兩端時,Mann-Whitney U並無法適切地呈現比較的結果。例如治療焦慮(anxiety)的用藥,對某些人來說有可能降低焦慮的症狀,但對某些人來反而會更加嚴重,此時焦慮反應程度便是分佈於兩端。
上述的例子中,使用Moses 極端反應檢定方法是更爲恰當的選擇;也就是說,比較的是兩組資料的散佈狀態(dispersion)是否相似。不同於Mann-Whitney U test, Moses 極端反應檢定的虚無假設爲H0: 兩組的極端值是相近的。所以,當研究者有合理的證據(文獻佐證)認爲反應值的資料並非集中於中央,而是偏斜(skewed)或群集於兩端時,Moses 極端反應檢定方法更加適當。在統計軟體的運用方面,SPSS中無母數檢定模組中即有此檢定方法;另外,SAS以及R也可以進行Moses 極端反應檢定,此檢定方法幾乎可見於大部份的統計軟體。
Reference:
Moses, L. W., "Non-Parametric Statistics for Psychological Research," Psychol. Bull., 1952, 49, 122-143.
estat 發表在 痞客邦 留言(0) 人氣(468)