在許多醫學研究中,所收集到反應變數的資料爲有序型態(ordinal data);例如評估某種疾病嚴重度, 0, 1, 2, 3, 4此即爲典型的有序資料----也就是說,數字本身除了區分嚴重度的不同類別外,數字的大小還具有程度上的差異。針對此種資料,當成連續型資料來分析並不合適,而使用類別型資料常用的卡方檢定則無法兼顧到有序資料的所有特性,所以常見的分析方式爲無母數的Kruskal-Wallis H test。而Bross在1958年提出了另一個方式:計算Ridit score來分析。其想法爲先找一較大的資料爲標準母體,計算出ridit score(爲0~1之間的數字,代表位於某一等級的累積機率),再將算出的ridit score取代原先的各組的有序資料來進行傳統的連續型資料分析;換句話說,將原先的有序資料轉換爲連續資料,再進行像各組平均值比較(t test, ANOVA)等方法。
- 9月 16 週二 201411:11
有序型資料的比較:參照特定分佈單位分析(Ridit analysis)
在許多醫學研究中,所收集到反應變數的資料爲有序型態(ordinal data);例如評估某種疾病嚴重度, 0, 1, 2, 3, 4此即爲典型的有序資料----也就是說,數字本身除了區分嚴重度的不同類別外,數字的大小還具有程度上的差異。針對此種資料,當成連續型資料來分析並不合適,而使用類別型資料常用的卡方檢定則無法兼顧到有序資料的所有特性,所以常見的分析方式爲無母數的Kruskal-Wallis H test。而Bross在1958年提出了另一個方式:計算Ridit score來分析。其想法爲先找一較大的資料爲標準母體,計算出ridit score(爲0~1之間的數字,代表位於某一等級的累積機率),再將算出的ridit score取代原先的各組的有序資料來進行傳統的連續型資料分析;換句話說,將原先的有序資料轉換爲連續資料,再進行像各組平均值比較(t test, ANOVA)等方法。
- 9月 16 週二 201401:44
癌症工業的騙局?還是維生素B17的騙局?

今早筆者從網路上看到一篇文章─「癌症已經有解:維生素B17 」(http://tw.gigacircle.com/1827492-1),文中提及克雷布斯博士(Dr. Krebs)[ 註:出生於1911年] 建議:『成人每日以10粒杏仁來預防癌症,每日30-50粒為癌症病人的營養補充品。』
- 6月 04 週三 201419:09
SigmaPlot的顏色編輯

在使用 SigmaPlot 繪圖時,對於不同組別顏色的設定,是否感到苦惱?若想製造漸層效果,卻不知從何下手,今日將解決您對顏色設定的疑慮。
SigmaPlot 的顏色其實可被當成物件插入資料檔中,而不須受限於預設的框架。
- 5月 23 週五 201419:05
您知道何謂Correlation(相關)?讓一群舞者跳給您看!
原來統計觀念的傳達方式可以這麼多元,今天要介紹的影片是由英國心理學會 (British Psychological Society; BPS) 募集資金製作的,希望透過舞蹈的趣味讓更多心理學系學生對統計觀念有更深刻的印象,是否覺得英國人很有創意呢?
- 5月 10 週六 201416:57
來自英國BBC的創意統計圖─兩百年來的各國財富與健康變化
當統計與近兩百年的人類歷史結合,我們來看看能說出什麼樣的故事?
- 5月 08 週四 201420:31
統合分析(Meta-analysis):出版偏誤(publication bias)問題
在統合分析中,針對合併後的總效果量(pooling effect size)去加以解釋說明該研究主題的統整結果;然而,由於收集的文獻中可能有出版偏誤(publication bias)而導致結果並不可信。所謂的出版偏誤即爲在大多數狀況下,研究人員總會傾向將有正向效果的文章發表,而負向效果的文章則不加以發表;就另一方面而言,或是期刋的編輯也傾向接受有正向效果的文章,而造成具負向效果或無明顯效果的文章不易爲人所知;這就形成了在收集文獻時,某些應存在的研究結果不易被發現。
一般在統合分析中常見去檢驗收集到的文獻中是否有出版偏誤的方式爲畫出漏斗圖(funnel plot),亦即以視覺化的方式來呈現正向效果以及負向效果的文獻是否如同漏斗形一樣對稱,如果是,則代表無出版偏誤。而除了漏斗圖之外,常見的方法爲計算失敗安全數(fail-safe N),所計算出的失敗安全數越大,即代表整合的效果量越穩健(robust),越沒有出版偏誤的情形。而分析軟體上常見的方法有:Rosenthal失敗安全數,orwin失敗安全數。以Rosenthal失敗安全數爲例,假設算出之失敗安全數爲253,其解讀爲如果要將目前顯著的整合效果量轉變成爲統計上無顯著意義,需要有253篇結果爲無明顯效果的文獻加入分析。統計分析軟體部份,SAS, R, CMA皆可進行失敗安全數的計算及繪製漏斗圖。最後,對於出版偏誤的現象應從根本來避免,最好的方式是從擬定嚴謹的收集文獻方法開始以儘量不使出版偏誤的產生。
Reference:
Orwin, R. G. (1983). A fail-safe N for effect size. Journal of Educational Statistics, 8, 157 – 159.
Rosenthal, R. (1979). The file drawer problem and tolerance for null results: Psychological Bulletin Vol 86(3) May 1979, 638-641.
- 4月 30 週三 201414:26
如何利用簡單線性回歸判斷中介變數(Mediator)
今日要介紹的分析方法為中介回歸(mediated regression),透過這個方法,可以瞭解哪些變數是中介變數(mediator)。
- 4月 27 週日 201402:22
統計與生活-台大學生心目中『好甜』的統計課
之前在以斯帖的部落格發表了「21世紀最夯的職業─資料科學家」一文,文中不難看出統計學與產業營銷策略的息息相關,而統計學在生活各個領域的應用更是隨處可見,統計學的應用與發展勢必是未來重要的趨勢。然而很多的時候,統計學仍是鎖在象牙塔內的高深知識,艱澀難懂的語言與數學公式,讓人望而卻步,遑論如何與生活連結,甚至讓普羅大眾善用簡易的統計方法,使生活中摭拾可得的數據成為點子與創意的來源。
- 4月 20 週日 201414:38
R軟體-兩樣本平均值比較(一)

獨立樣本t檢定(independent t test):
研究者欲比較兩組資料的平均值是否有統計上的顯著差異,且兩組資料間必須是獨立樣本。例如:比較實驗組與對照組的身高是否相同。
- 4月 20 週日 201414:05
SAS中的資料轉置(Transpose)- III
以下將介紹以Transpose將資料橫轉直的簡單語法。
在[程式一] 建立資料檔AA中,為同一個人在不同時間的分數, 包含ID(身份證號), SEX, score(分數), 等欄位。
[ 程式一]data aa;
input id $ sex $ score1-score6;
cards;
A01 F 63 75 68 86 77 91
A02 M 75 65 87 89 72 88
;
proc print;
run;
若研究者想依score1-score6等6個分數將每個人的資料橫轉直, 並保留個人基本資料, 可利用[ 程式二]完成。
1. 首先宣告執行TRANSPOSE程序, 資料來源為AA;
2. 其次將轉置後結果存入檔案BB中(OUT=BB);
3. 以Name=transposed_by 標示被轉置之欄位名稱(可任意書寫), 若不執行此項, 通常預設欄位名稱為 _NAME_;
4. 以VAR指定轉置的欄位,此例以score1-score6等6個分數進行橫轉直的轉置;
5. 以BY指定轉置的依據, 例如此例之基本資料ID(身份證號), SEX,即轉置的條件是依每一個人的基本資料去轉。
6. 以RENAME將橫轉直後的新欄位名稱col1改為SCORE
[ 程式二]