在許多臨床試驗中,由於針對某些疾病個案的收集不易(或是phase II trial ,僅收集較少的個案),所以造成後續可用來進行統計分析的樣本數不大,此時常見的分析方法爲無母數方法(non-parametric method)。針對數值型的反應變項(response),如欲比較實驗組和控制組間,反應值是否有差異Mann-Whitney U test爲最常用的分析方法。然而,當反應值的分佈狀況並非聚集於中央而是群集於兩端時,Mann-Whitney U並無法適切地呈現比較的結果。例如治療焦慮(anxiety)的用藥,對某些人來說有可能降低焦慮的症狀,但對某些人來反而會更加嚴重,此時焦慮反應程度便是分佈於兩端。

上述的例子中,使用Moses 極端反應檢定方法是更爲恰當的選擇;也就是說,比較的是兩組資料的散佈狀態(dispersion)是否相似。不同於Mann-Whitney U test, Moses 極端反應檢定的虚無假設爲H0: 兩組的極端值是相近的。所以,當研究者有合理的證據(文獻佐證)認爲反應值的資料並非集中於中央,而是偏斜(skewed)或群集於兩端時,Moses 極端反應檢定方法更加適當。在統計軟體的運用方面,SPSS中無母數檢定模組中即有此檢定方法;另外,SAS以及R也可以進行Moses 極端反應檢定,此檢定方法幾乎可見於大部份的統計軟體。

Reference:
Moses, L. W., "Non-Parametric Statistics for Psychological Research," Psychol. Bull., 1952, 49, 122-143.


文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

在許多醫學研究中,所收集到反應變數的資料爲有序型態(ordinal data);例如評估某種疾病嚴重度, 0, 1, 2, 3, 4此即爲典型的有序資料----也就是說,數字本身除了區分嚴重度的不同類別外,數字的大小還具有程度上的差異。針對此種資料,當成連續型資料來分析並不合適,而使用類別型資料常用的卡方檢定則無法兼顧到有序資料的所有特性,所以常見的分析方式爲無母數的Kruskal-Wallis H test。而Bross1958年提出了另一個方式:計算Ridit score來分析。其想法爲先找一較大的資料爲標準母體,計算出ridit score(0~1之間的數字,代表位於某一等級的累積機率),再將算出的ridit score取代原先的各組的有序資料來進行傳統的連續型資料分析;換句話說,將原先的有序資料轉換爲連續資料,再進行像各組平均值比較(t test, ANOVA)等方法。


所以,由上述可了解,參照特定分佈單位分析(Ridit analysis)的好處在於可以使用傳統連續型資料的分析方法,而不破壞原始有序資料的特性。在適用的統計軟體部份,常見的軟體SAS, SPSS, STATA, R等皆可進行Ridit score的運算。

Reference
Bross, I.D.J. "How to Use Ridit Analysis", Biometrics 14, 1958, pp.18-38.


文章標籤

estat 發表在 痞客邦 留言(1) 人氣()

 

今早筆者從網路上看到一篇文章「癌症已經有解:維生素B17 (http://tw.gigacircle.com/1827492-1),文中提及克雷布斯博士(Dr. Krebs)[ 註:出生於1911建議:『成人每日以10粒杏仁來預防癌症,每日30-50粒為癌症病人的營養補充品。』

 

因為好奇, 今早查了一些網路資訊, 發現克雷布斯(Krebs)曾被退學, 且無博士學位(Wikipedia)[1]。他宣稱維生素B17的療效,而維生素B17來自有苦杏仁苷(laetrile)的植物中提取合成的化學物質,苦杏仁苷是來自非柑橘類種子,例如櫻桃、杏仁等。克雷布斯認為維生素B17可分解苯甲醛和氫氰酸,對腫瘤細胞可有選擇性殺傷作用,而不會傷害正常細胞,他因此研發成藥物並公開販售

 

杏仁  

 

事實上,有文獻指出,食用過多的苦杏仁苷可能造成氰化物中毒。若大家有留意維生素的分類,維生素B群包括:B1B2B6B12、葉酸、泛酸、菸鹼酸、生物素等,並無B17。一則台灣的新聞指出,一罹癌老翁服用購自網路的維生素B17,因服用過量造成氰化物中毒[2]

 

有一篇被列入Google學術蒐尋的文章The Cancer Business」即提出所謂癌症正規療法(放化療等)提供美國癌症工業大筆獲利,是醫學界為獲暴利的騙局,並提出這些療效的有限性, 以及維生素B17在癌症治療上的優勢[3]。姑且不談臨床上的療法對癌症病人的健康傷害,抑或為騙局否?這篇文章的出處標示不清,其學術公信力大打折扣,不過國內外的網站仍不乏堅稱維生素B17具有療效的民眾。

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

在使用 SigmaPlot 繪圖時,對於不同組別顏色的設定,是否感到苦惱?若想製造漸層效果,卻不知從何下手,今日將解決您對顏色設定的疑慮。

SigmaPlot 的顏色其實可被當成物件插入資料檔中,而不須受限於預設的框架。

下圖為 2 組資料的盒鬚圖(Box Plot),當畫完圖後,預設顏色為灰色,如何才能將不同的盒鬚圖配給不同的顏色?而改成五彩繽紛的圖?

SigmaPlot_color1  

 SigmaPlot_color16  

點入『Graph page』後,點選 Porperty Browser下方的Plots,並將其點開,並進入Data points下方的Fills。此時下方對應的視窗為Object Properties,此時可看到 2 組的預設都為gray(灰色)。

  SigmaPlot_color2   

若您將Gray(灰色)改成Cyan(天空藍),結果 2組的顏色都變為Cyan。事實上,您是希望兩組的顏色是不一樣的,但事與願違,因為 2 組在同一張 plot () 上,若欲改動顏色, 2 組會一起被更改。

SigmaPlot_color17  

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

原來統計觀念的傳達方式可以這麼多元,今天要介紹的影片是由英國心理學會 (British Psychological Society; BPS) 募集資金製作的,希望透過舞蹈的趣味讓更多心理學系學生對統計觀念有更深刻的印象,是否覺得英國人很有創意呢?

  

 

影片中,以紅衣舞者與黑衣舞者代表不同的變項(Variable),舞者的表演分為三段:

第一段的表演所呈現的是「正相關」(positive correlation),紅衣舞者與黑衣舞者的移動方向與動作是一致的,當一個變項改變,另一個變項也以相同方式改變。在統計上以 r 表示相關係數(correlation coefficient),當資料呈「正相關」,r 的數值為正的,最大值為1,代表兩者的改變是完全一致的。

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()



    當統計與近兩百年的人類歷史結合,我們來看看能說出什麼樣的故事?

 

 

英國BBC利用120,000個數據資料說明近200年的人類歷史,主軸環繞在200多個國家的健康與財富,統計圖的創意來自與動畫攝影技巧的結合,使200年如同穿梭了時光機,從過去回到了現在。


以下是文中的內容說明:

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

在統合分析中,針對合併後的總效果量(pooling effect size)去加以解釋說明該研究主題的統整結果;然而,由於收集的文獻中可能有出版偏誤(publication bias)而導致結果並不可信。所謂的出版偏誤即爲在大多數狀況下,研究人員總會傾向將有正向效果的文章發表,而負向效果的文章則不加以發表;就另一方面而言,或是期刋的編輯也傾向接受有正向效果的文章,而造成具負向效果或無明顯效果的文章不易爲人所知;這就形成了在收集文獻時,某些應存在的研究結果不易被發現。


一般在統合分析中常見去檢驗收集到的文獻中是否有出版偏誤的方式爲畫出漏斗圖(funnel plot),亦即以視覺化的方式來呈現正向效果以及負向效果的文獻是否如同漏斗形一樣對稱,如果是,則代表無出版偏誤。而除了漏斗圖之外,常見的方法爲計算失敗安全數(fail-safe N),所計算出的失敗安全數越大,即代表整合的效果量越穩健(robust),越沒有出版偏誤的情形。而分析軟體上常見的方法有:Rosenthal失敗安全數,orwin失敗安全數。以Rosenthal失敗安全數爲例,假設算出之失敗安全數爲253,其解讀爲如果要將目前顯著的整合效果量轉變成爲統計上無顯著意義,需要有253篇結果爲無明顯效果的文獻加入分析。統計分析軟體部份,SAS, R, CMA皆可進行失敗安全數的計算及繪製漏斗圖。最後,對於出版偏誤的現象應從根本來避免,最好的方式是從擬定嚴謹的收集文獻方法開始以儘量不使出版偏誤的產生。

Reference:
Orwin, R. G. (1983). A fail-safe N for effect size. Journal of Educational Statistics, 8, 157 – 159.
Rosenthal, R. (1979). The file drawer problem and tolerance for null results: Psychological Bulletin Vol 86(3) May 1979, 638-641.

 


文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

今日要介紹的分析方法為中介回歸(mediated regression),透過這個方法,可以瞭解哪些變數是中介變數(mediator)

在回歸分析中,當研究者以一自變數(Independent Variable ,IV)去預測依變數(Dependent Variable, DV),且其預測能力有統計上的顯著意義,其影響可能純粹來自自變數(IV),亦可能透過中介變數(Mediator, M)影響依變數(DV)。若將中介變數放入模式中,自變數(IV)的係數變小,但對依變數(DV)的影響仍然顯著,此中介變項對模式的影響為Partial mediation,即自變數(IV)對依變數(DV)的雖有影響,但有一部份是透過中介變項影響依變數(DV)。若將中介變數放入模式中,自變數(IV)的係數變小,但對依變數(DV)的影響已不顯著,此中介變項對模式的影響為Full mediation,即自變數(IV)對依變數(DV)的影響不顯著,而是完全透過中介變項影響依變數(DV)

mediated regression 1

 

根據上圖可以放入3個回歸模式檢驗自變數(IV)、依變數(DV)中介變項(Mediator)3者的關係。

  

思考題?

當研究者觀察到認知態度對空腹血糖值有影響時,真的是認知態度影響了空腹血糖嗎?還是透過其他未知的變數直接或間接影響空腹血糖值?

 

文章標籤

estat 發表在 痞客邦 留言(5) 人氣()

 

之前在以斯帖的部落格發表了「21世紀最夯的職業資料科學家」一文,文中不難看出統計學與產業營銷策略的息息相關,而統計學在生活各個領域的應用更是隨處可見,統計學的應用與發展勢必是未來重要的趨勢。然而很多的時候,統計學仍是鎖在象牙塔內的高深知識,艱澀難懂的語言與數學公式,讓人望而卻步,遑論如何與生活連結,甚至讓普羅大眾善用簡易的統計方法,使生活中摭拾可得的數據成為點子與創意的來源。

  

今天要介紹台灣大學的通識教育課程─『統計與生活』,該課程係提供給文學院與法律學院學生選修的課,顧名思義,課程會不斷環繞在日常生活的相關議題,藉由讓學生瞭解量化推理與數學的思考方法,以及瞭解生活上常用的統計分析工具的理論基礎,進而培養學生欣賞統計學「以簡馭繁的精神和結構完美的特質」。

 

以下是台大開放式課程的相關網址,提供了這門課完整的上課影音與講義,且可自行下載,對國人的統計教育無疑是開啟了更便捷的學習管道。該課程的上課內容已集結成書,書名即為「統計與生活」,在國內各大網路書店都可購買,教師群以台大的統計學教授掛帥。

 

http://ocw.aca.ntu.edu.tw/ntu-ocw/index.php/ocw/cou/100S216

 

筆者在台大的批批踢看到上課學生的留言,不禁莞爾,有學生說道:「想混學分? 選統計與生活就對了!... 想要被當掉比拿grade A還要困難。」、「想學到東西? 選統計與生活就對了!...另外試想和心儀的女同學/男同學,一起觀賞日劇時,能解說偏差值所代表的意義;一起收看新聞時,能講解民意數字的背後意涵。必定增進生活情趣,兩人感情加溫。」,還以統計與生活是好(甜)的課。」作總結,看來統計老師們的用心,學生都感受到了。由於課程偏重在課後的分組討論,學生們利用統計學所發揮的創意就更無邊無際,如此一來,統計不就脫下了艱澀的外袍,以親切之姿走進了學生的生活之中,這應該才是教授統計學最重要的目的吧!

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

獨立樣本t檢定(independent t test)

研究者欲比較兩組資料的平均值是否有統計上的顯著差異,且兩組資料間必須是獨立樣本。例如:比較實驗組與對照組的身高是否相同。

此範例為比較男生與女生的BMI值是否相同,由於男生與女生是獨立的樣本,故將使用獨立樣本t檢定來分析。


[程式]

>sexbmi=split(bmi,sex) #.將資料分割不同性別BMI分佈情形,並加以命名

>var.test(sexbmi$"1",sexbmi$"2") #.檢定兩組變異數是否相同?

>t.test(sexbmi$"1",sexbmi$"2",var.equal=T) #.檢定兩組樣本平均數是否相同(變異數相等)

>t.test(sexbmi$"1",sexbmi$"2",var.equal=F) #.檢定兩組樣本平均數是否相同(變異數不相等)

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()