目前分類:淺談研究設計 (16)

瀏覽方式: 標題列表 簡短摘要

 

2010年歐盟EMA與歐洲ENCePP網路中心(European Network of Centers for Pharmacoepidemiology and Pharmacovigilance)共同發布「藥物流行病學方法學標準的指南」草案(Draft CUIDE ON Methodological Standards in Pharmacoepidemiology),該指南是為了確保高品質的藥物流行病學研究,以加強藥品上市的安全性監測,以期維護民眾的健康,而今,ENCePP的指南仍是從事藥物流行病學研究及臨床流行病學研究的重要參考依據[1,2]在該指南中提到了幾項重要的研究偏誤,是值得關注的

 

利用健保資料庫分析作為藥物的安全性監測已行之多年,但不良的研究設計容易造成各種推論的偏誤(bias),其中一項重要的偏誤往往導致所觀察的藥物被宣稱對疾病有保護作用,或能降低不良反應,這種偏誤與觀察的時間有關,被稱為immortal time bias

 

根據加拿大Suissa博士 2007年發表於Pharmacoepidemiology and drug safty[3]的文章所描述,許多文章都因immortal time bias而誇大了藥物的保護作用,若經由校正藥物的time-dependent definition(後面會再解釋) ,研究結果就不再顯著,甚至結果是相反的。 並且immortal time愈長,造成的 bias就愈大 兩者成正比 。而immortal time bias是如何發生的呢?

 

Immortal time係指當病人被診斷為特定疾病至開始用藥的這段時間[2,3] immortal time bias主要發生在Immortal time這段時間,一是將暴露組(用藥組)person-time做出錯誤的歸類(misclassification),二是將暴露組的Immortal time刪除。筆者試著以下面的兩張插圖(繪圖:S. Suissa PhD)做進一步的解釋:

 

image

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

過去10年,學術界一窩蜂地以健保資料庫作為『省錢、省時、省力』的研究方法,由於過於浮濫的發表,有些學校已嚴格限制健保資料庫作為升等的題材,究竟這麼珍貴的資料庫,何以成為被學界所垢病的次級資料(secondary data),究竟這個領域的研究限制是什麼?而它獨步全球的優勢又是什麼?

 

在還未有健保資料庫之前,醫藥研究不外乎臨床試驗、在臨床或社區收問卷、收檢體、環境採樣等等,可用來作為分析的大型資料庫,主要是健保開辦前的勞保門診與勞保住院資料、癌症登記檔、死亡檔,也有研究採用健檢診所的會員資料。綜觀以上的資料,有其優勢,但研究限制也不少,樣本的代表性是主要的問題。

 

但健保資料庫經由國家衛生研究院的整理並釋出後,全國性的抽樣資料,或全國性的特定族群資料,可依循合法的申請管道取得,這些代表全國性的資料,不僅量大,亦可解決流行病學上的選樣偏差問題,由於完整記錄病人的就醫記錄,包括疾病診斷代碼以及醫令代碼,儼然是最佳的藥物流行病學的分析材料,除非病人自費就醫。由於是全國性的資料,在國際間自有一定的學術價值,但學者抨擊之處所為何來?

 

健保資料庫最大的特徵是病人就醫的費用申報檔,無論病因是否正確,為了通過健保費用申報的相關規定,有部份代碼並非確實申報,甚至與疾病本身無關;有些病人還在檢查階段、尚未確診,卻以疑似病因登錄。過去賴美淑教授依據健保資料庫進行糖尿病診斷的正確性(validation)研究,發現當每一筆診斷皆納入研究,正確性約七成,若將前2次診斷當作是因檢查而登錄,留下了3次以上的就醫記錄,正確性提高至八成以上,若以是否使用降血糖藥作為判斷依據,正確性提高至九成以上。因此作了一些定義後,正確性將逐步提高,但不可否認的,誤歸類(misclassification)的比例仍高達一成。有些重大疾病可藉由串聯重大傷病檔以作為確認,但早期重大傷病卡的申請率非100%,卻造成研究個案數的低估。此外,在存活分析研究中,死亡的個案,除了因重大傷病死亡、院內死亡,其他院外之種種死因無法被記錄,在分析上是一大限制。

 

而一般研究在資料庫中所引用的人口學變項,不外乎性別、年齡、以投保單位所在地代表工作與生活地區的都市化程度、以投保薪資代表收入高低、有無工作、是否低收入戶等,大家很快就可提出這些項目在資料庫中的問題所在,毋庸贅述。更何況比前述更重要的生活習慣(例如抽菸、運動、飲食等)與各種檢驗值,都不在這個資料庫中。因此過去的研究以特定的共病或共病指標(例如Charlson Comorbidity Index; CCI)代替不良生活習慣可能導致的疾病,例如以發生肺部疾病代替抽菸習慣,但兩者的關聯有些牽強,因此,在健保資料庫中,當為了解決一個問題,就可能衍生另一個錯誤分組的機會。

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

一、研究設計

 

    健保資料庫的研究設計主要為回溯型世代研究(Retrospective cohort study),研究者提出資料申請時,研究世代已存在於健保資料庫中,因此所作的研究為回溯型的研究。利用健保資料所進行的Case-control study (病例對照研究),可進一步定義為Nested case-control study(巢式病例對照研究),當研究者以特定的病例(Case)配對一定比例的對照組(control),病例組與對照組來自相同的世代,且這世代早已存在於保存完善的資料庫中,故可稱為Nested case-control study

 

    在健保資料庫中,配對(matching)是常見的控制干擾因子的方式,配對的時間點若是暴露開始時間(例如給藥開始時間、開始接受心理治療時間、剛診斷為憂鬱症時間),在研究設計上屬於世代研究法(cohort study),研究者將回溯到病人暴露開始的時間點,再繼續追蹤病人後續的病情變化(康復、復發、死亡,或發生不良反應等),以探討暴露對疾病發展的影響。在有暴露組與非暴露組的情況下,可以建立暴露風險指標,以比較兩組的相對風險。較常使用的風險指標包括:直接標準化率比 (Standardized Rate Ratio; SRR)、間接標準化發生比(Standardized Incidence Ratio; SIR)、間接標準化死亡比(Standardized Mortality Ratio; SMR)、風險比值(Hazard  Ratio; HR)、相對危險比值(Relative Ratio; RR)等。

 

  健保研究設計1   

 健保資料庫的回溯性世代研究

 

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()


在醫學研究上,針對感興趣的結果變項(outcome)去找出影響因子常會使用到線性迴歸模式(linear regression model), 邏輯斯迴歸模式(logistic regression model)等方法,而其目的除了要找出顯著的影響因子外,有時還須評估模式的預測能力。例如:研究者欲找出影響代謝症候群的因素,所以建立一邏輯斯迴歸模式,而模式一旦建立後,如有一新個案的資料,代入影響因子的值,即可預測其有代謝症候群的可能性有多高。而交叉驗證(Cross-Validation)可以用來檢視模式預測能力的好壞。


常見的交叉驗證方法有二折交叉驗證(2-fold cross-validation),十折交叉驗證(10-fold cross-validation),而以十折交叉驗證較常被運用。其想法即爲將原始的資料先分割成十等份,取其中九等份(training data)來進行建模分析(model building),而留下的一等份則爲驗證資料(validation data);也就是說,用來驗證模式預測的精確度。以邏輯斯迴歸來說,即是進行十次的建模,以及驗證過程,再將十次結果的精準度(accuracy)取平均,最後再呈現平均的精準度。一般而言,在分析軟體方面,R提供了k-fold cross validation的套件,可以直接套用進行分析。

Reference:
Kohavi, Ron (1995). "A study of cross-validation and bootstrap for accuracy estimation and model selection". Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence 2 (12): 1137–1143.


文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

在臨床試驗中,多中心臨床試驗(Multicenter trial)爲較常採取的方式,其原因在於相較於單一中心(single center)的收案,多中心的收案其個案來源爲更廣的範圍,樣本更具有代表性。但同時,由於個案並非來自同一中心,在統計分析時就面臨到了不同中心可能有異質性(heterogeneity)的問題,在處理分析時變得更加地複雜。

正因爲如此,有學者建議 (Chakravorti and Grizzle, 1975)不同中心的效應(center effect)應視爲隨機效果(random effect)較爲合理;也就是說,將不同中心所得到的資料設定爲異質,再以混合模式(mixed model)來分析,得到最後的總治療效果(overall treatment effect)。除此之外,通常還需要呈現各中心所收集個案的基本資料,起點測量值(baseline value),以及組別間的平均差異值(difference in mean)。在統計圖形的部份,則需將各中心所分別計算出的治療效果放在同一張圖中以做比較(標示出兩組的平均差異值,以及其95% C.I.),才能看出是否有某一中心其結果較爲極端,需要加以探討。

 

 

Reference:
U.S. FDA Guideline for the Format and Content of the Clinical and Statistical Sections of an Application, 1988

 


文章標籤

estat 發表在 痞客邦 留言(2) 人氣()

 

在臨床研究中,長期追蹤資料常由於受試者的某些原因(例如身體產生不良反應(AE),或是失去連繫(loss of follow-up)等原因)而產生缺失值(missing value)。在某些狀況下,缺失值可能有重要的訊息,如果忽略不考慮,會對研究的結論造成很大的影響。所以,先要了解資料中的缺失值是屬於何種型態,再去尋找合適的處理方式。缺失值型態主要可分爲三種: MCAR(missing completely at random), MAR(missing at random) or NMAR(not missing at random)


在處理缺失值的部份,有三大類的方法:(1) 完整資料分析(complete case analysis),亦即只使用個案中完整無缺失值的,才納入分析(2) 可用資料分析(available data analysis),所有收集到的資料,即使僅有部份,也納入分析;(3) 補值法(imputation),對缺失值的部份先補值,再做分析,又可分爲單一補值(single imputation)及多重補值(multiple imputation)。其中,單一補值法常用的爲last observation carried forward(LOCF)以及baseline observation carried forward(BOCF)


MCAR的情形下,可以不對缺失值做處理,而直接就收集到的資料加以分析,但以(2)(3)的方法較佳;此外,如果缺失值的型態爲MAR,則建議以多重補值法爲較佳的處理方式。



Reference:

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 


在臨床試驗的前期,交叉試驗(crossover trial)是被廣爲使用的設計方法,用來測試人體對藥物的反應(response)。最常見的交叉設計爲AB-BA設計;也就是說每一個受試者隨機進入試驗後都要接受二種不同的治療方式(treatment),一組先接受A treatmentB treatment;另一組則是先B treatmentA treatment。而在接受不同的治療方式中間,會有一段洗滌期間(washout period),其目的在於消除治療方式造成的延續性效應(carry-over effect),以正確的測試出真正的治療成效。



交叉設計最大的缺點在於前面提到的延續效應以及治療順序效應(order effect),兩者皆會干擾真正的治療效應(treatment effect),所以要特別注意的是,洗滌期間不能過短,以免造成延續性的效應。儘管如此,交叉設計也有其優勢:第一是需要較少的受試者即可達到試驗的目的(這也是臨床試驗前期大多使用交叉設計的理由之一),第二是每個受試者皆爲自已的對照(control),可適當的控制干擾因子(confounding factors)的影響。統計分析方法的部份,交叉試驗大多使用混合模式(Mixed model)來分析資料。



文章標籤

estat 發表在 痞客邦 留言(2) 人氣()

 


在非劣性試驗(non-inferiority trial)中,主要的目的是在於檢驗新的藥物效果不比現存的藥物差或是效果更好。而等同性試驗(equivalence trial)則是在於驗證新的藥物與現存的藥物具有相等的療效,在臨床的應用上,通常除了檢驗其療效相等之外,很重要的一點是新藥一般而言會降低不良反應(adverse event)發生的比例。不過,在實際收個案時,等同性試驗需要比非劣性試驗或是較優性試驗(superiority trial)所需的樣本數更大,這使得實行上難度大大的提升。


就統計檢定的觀點而言,等同性試驗的虚無假設(null hypothesis, H0)爲新藥與舊藥的效果不相等,所以當拒絕虚無假設時即代表兩者有相同的效果。由統計上的虚無假設對比於非劣性試驗可發現,非劣性試驗是單尾的(one-tailed);等同性試驗是雙尾的(two-tailed)。與非劣性試驗同樣的是,等同性試驗也要事先定出療效差異值(margin),再去檢驗其結果。統計分析上,等同性試驗多以比較信賴區間(confidence interval: CI)的方式,來決定試驗結果是否爲等同的效果。



Reference

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 


在長期追蹤型的臨床試驗中,通常不太可能在極短的一段時間內,將所有個案收齊,而是陸續進入試驗中。此外,針對療效及安全性,在試驗收案的中途,經常會進行期間分析(interim analyses),以決定是否提前結束試驗;也就是說,如果在期間分析中已發現療效存在,或是有安全性的疑慮,必須提前中止試驗,以符合經濟的效益。針對上述的理由,群組序列設計(Group sequential design)即爲較合適的試驗設計方法。


群組序列設計試驗,由於要進行一次以上的期間分析,在統計檢定上易膨脹型一誤差(type I error),所以必須事先明確的定義出期間分析的次數及試驗停止的邊界值(boundary),以得到可信的結果。常見的檢定設計過程爲:假設進行K次檢定,其中Zi爲每次檢定的統計量,則Z1,Z2,…,Zk-23, Zk-1>3, Zk>1.96。有關Z值的部份還有一些學者提出不同的調整方式,以得到更精準的檢定結果。


Reference:

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

非劣性臨床試驗(Non inferiority trial)有別於一般常見的較優性試驗(Superiority trial),其主要目的在於驗證新的藥物或治療方式其效果不比現存的藥物或治療方式差。在實際的應用上,大多是因爲現存藥物雖然療效較佳,但使用上不夠便利,或是安全性不佳;基於這些原因,有必要去開發新的用藥,證明其療效不比現存的差,但能解決上述所提到的問題。在進行非劣性臨床試驗時,首先,就是要先定出新藥與現存的藥物可接受的療效差異值(margin),以進行樣本數的估算及後續的試驗。


margin的設定方面,較佳的方式爲參考之前類似試驗所發表的文獻,如能收集到較多文獻,則可以統合分析(meta-analysis)的統計方法來推估;如僅有一篇或無任何文獻可參考,則宜考量到臨床上的合理性,定出一個保守的margin。此外,非劣性臨床試驗一般來說,所需要的樣本數會比較優性試驗來的大;在統計分析對象選取部份,同時以Intention to treat(ITT)Per protocol(PP)來呈現比較其分析結果,會是較爲適當可接受的方式。



Reference:

ICH E9 Guideline, Statistical Principles for Clinical Trials.

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 


交替式追蹤設計(rotating panel study design)爲一般追蹤性研究設計(panel study design)的變化。相較於傳統的追蹤設計,交替式追蹤設計中單一個體(subject)之追蹤時間相對較短,可降低受試者不耐久擾之情形,且樣本缺失值(missing value)較不易發生;另外,樣本資料較不易產生長期習慣性(conditioning)則是此設計重要的優點。除此之外,新追蹤樣本之隨著時間點逐漸加入,提供了母體更新之資訊,適時地反應出研究群體隨不同時間點所產生的變化。


交替式追蹤設計資料可視爲一般長期追蹤性資料來進行分析,也就是說同一個體(subject)在某些時間點的觀察值是沒有的(因爲在研究設計階段,研究者已規劃好每一時間點要選取的個體爲何,而並非所有個體都追蹤)---視爲缺失值(missing value),而此種缺失值是屬於完全隨機型的缺失值(MCAR),所以即使在不補值(imputation)的情形下,依舊可以得到有效的估計值。有關統計分析方法,交替式追蹤設計可以使用一般追蹤資料所常見的分析方法: Mixed model, GEE, GLMM來分析,解釋最後的研究結果。


Reference:

文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

在很多醫學及流行病學的研究中,多以建立大型的世代(cohort)來對個體進行研究。在分析感興趣的結果(outcome)時,常需要進立迴歸模式(regression model),以控制干擾因子(confounding factors),得到較爲正確結論。然而,由於並非所有個體的干擾因子皆可很容易的取得,尤其在研究世代樣本較大的情形下,此現象更爲明顯。正因如此,有學者提出了二階段的抽樣設計方法(two stage sampling)以解決這種問題;簡單的來說,即爲在第一階段先對研究世代中的個體收集結果變項(outcome variables)及較易取得的干擾變項,例如常見的性別,年齡等,接下來,再由第一階段中的個體,抽出部份對象,來收集不易得到的干擾因子(例如有無特定疾病史,有無抽煙習慣,通常大多以問卷調查來得到此類的資料),再以整個第一,二階段收集到的資料來分析。

至於第二階段樣本的抽取方式,有許多不同的選擇,以常見的二元結果變項(binary outcome)爲例,假設研究問題爲探討學齡前兒童氣喘發生的主要因子。在第二階段的抽樣的常見方法爲:隨機抽樣(random sampling),個案病例對照設計(case-control design),平衡設計(balanced design)等。其中,以平衡設計對估計值(OR)而言,最爲有效率(efficient)。在進行統計分析步驟,須自行撰寫程式(SAS, R….),以完成繁雜的運算。 

Reference:
Neyman, J. (1938). Contribution to the theory of sampling from human populations. Journal of the American Statistical Association 33, 101-116.


文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

長期追蹤資料(Longitudinal data)常見於各領域研究中,由於對同一個體(subject),在不同時間點所收集到觀察值具有關聯性,所以依照研究目的不同(比較不同處置方式(treatment)的效果,找出影響因子,隨時間變化的趨勢(trend analysis))在分析上多使用廣義估計方程式(GEE), 混合模式(Mixed model), 廣義線性混合模式(GLMM)等方法。此外,長期追踨資料常出現的狀況爲:不同個體間,response隨時間變化的情形相差很多,以固定(fixed effect)效果來探討,分析結果並不恰當;較爲合適的處理是考慮隨機效果(random effect)

而群組化軌跡模式(Group-Based Trajectory Modeling, GBTM)即是先將response隨時間變化的情形分成幾大類,以使研究者可以了解主要的變化形態有哪幾種?每種所佔的比例爲何?更可以進一步地找出危險因子(risk factors),就分析的目的而言,與前述的方法是不一樣的。分析軟體部份,目前大都使用SAS來進行GBTM, 另外,Mplus, STATA, 以及R也都有可以分析GBTM的相關套件。

Reference:
Daniel S. Nagin, Candice L. Odgers(2010). Group-Based Trajectory Modeling in Clinical Research. Annu. Rev. Clin. Psychol., 6, 109–38.


文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

在很多研究當中,探討影響個體(subject)結果變項(outcome)的因子時,除了要考慮到個體自身收集到的解釋變數,同時也要考慮與個體存在高度相關的人,所收集到的解釋變數;例如常見的夫-妻,照顧者-被照顧者,此種資料稱之爲對偶資料(dyadic data)。很明顯的,對偶資料之間具有相關性,而且會影響對結果變項的解釋或預測。(舉例來說,結果變項爲:夫生活品質滿意度,解釋變項爲:夫社經地位高低,妻社經地位高低)

APIM在統計分析方面,如果使用傳統的多元迴歸分析(multiple linear regression),無法將解釋變數之間的相關性納入分析,所以並不恰當,原因在於多元迴歸分析中,解釋變數是假設爲獨立的。取而代之的,APIM多用多層次模型(Multi-Level Model: MLM)方法來分析,亦有人稱之爲階層線性模式法(Hierarchical Linear Model: HLM)。另外,也可以將每一對設定爲隨機效果(random effect)以混合模式(Mixed model)來分析之。


Reference:
Kenny, D. A. (1996a). Models of nonindependence in dyadic research. Journal of
Social and Personal Relationships, 13, 279–294.


文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

世代研究(cohort study)是運用相當廣泛的流病研究設計方法。但通常由於需要較大的樣本數,使得實行上時間和經費消秏相當大。也正因爲如此,才發展出了其它研究設計的方法,而重疊病例對照設計(nested case-control design)即爲其中一種。其設計的想法即是在一個世代研究中,套入病例個案對照(case-control)設計,所以亦有學者稱之爲世代內病例對照設計(case-control study within cohort)

重疊病例對照設計可以是前曕型(prospective)的也可以是回溯的(retrospective),對照組依照研究者事先定出的比例(例如常見的,病例:對照=11, 12)隨機在世代中挑選出來。在找尋對照組中,最大的特性在於時間配對(time matching);也就是說,對照組的選取必須在病例發生的時間進行。值得注意的是,在時間配對進行時,某時間點的病例有可能被選爲之前發生病例的對照組,這時必須要重新配對。在統計分析方面,重疊病例對照設計是使用條件邏輯斯迴歸(conditional logistic regression)來分析,解釋最後的研究結果。

Reference:
Ernster, V.L. (1994). Nested case-control studies, Preventive Medicine 23, 587–590
Mantel, N. (1973). Synthetic retrospective studies and related topics, Biometrics 29, 479–486.
Wacholder, S. (1995). Design issues in case-control studies, Statistical Methods in Medical Research 4, 293–309


文章標籤

estat 發表在 痞客邦 留言(0) 人氣()

 

病例交叉設計可以說是病例對照設計(case-control design)及交叉設計(crossover design)的綜合體,它兼具了上述兩種設計方式的特性。此外,一般來說,世代研究(cohort study)在實行時所面臨的難題,是如何選擇一個可進行比較的對照組。而在病例交叉研究中,每一個體(subject)可做為他自己的對照組。只有那些個體發生特定事件(亦即病例組),且同時於特定事件發生日期前的某段時間內有接觸過特定治療(treatment),才可以納入試驗的個案中。相同個體在治療結果發生前較短時間(case period)接觸過特定治療之勝算(odds),會與特定結果發生前較久時間(control period)有接觸過特定治療勝算(odds)相比較,以計算出勝算比(odds ratio; OR)來解釋最後的研究發現。


不過,病例交叉設計亦有其限制,例如無法找出危險因子(例如是否抽煙,以及是否有某種特定的disease),而這正是許多研究者想了解的部份。病例交叉設計最適合用於探討因爲短暫治療(treatment) (例如用藥與否)而導致急性事件(例如某種生化檢驗值是否上升或下降)的發生,但需要有足夠樣本的病例,這些病例必須發生過急性事件,且同時有近期或較久以前的時間接觸過藥物之記錄。

Reference:
Maclure M. The case-crossover design: a method for studying transient effects on the risk of acute events. Am J Epidemiol. 1991;133:144–53.


文章標籤

estat 發表在 痞客邦 留言(0) 人氣()