PIXNET Logo登入

以斯帖統計顧問公司

跳到主文

面對複雜的統計分析,是否感到不知所措?『以斯帖統計顧問公司』能幫您擷取最有價值的資訊。本公司的主要服務項目為統計教學、統計諮詢,並承接公家機關、國內外藥廠、醫院的研究委託案,數年來已累積大量的服務群,也深受許多好評。

部落格全站分類:不設分類

  • 相簿
  • 部落格
  • 留言
  • 名片
  • 2月 18 週二 202009:47
  • Python在健保資料庫的應用–歸戶、定義第幾次就醫、定義門診就醫三次以上

image
以下程式請在安裝pandas套件下,在 jupyter notebook 的 python 執行;
程式撰寫: 以斯帖統計顧問公司 Python課程講師 蔡勝雄老師(Amos)
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(530)

  • 個人分類:Python的應用
▲top
  • 2月 17 週一 202017:58
  • SAS中的first.variable與last.variable的應用

以下將介紹 first.variable 與 last.variable 的應用 , 利用這兩個指令,完成以下三項任務
   (1)歸戶
   (2)定義第幾次就醫記錄
   (3)定義門診就醫三次以上;
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(1) 人氣(6,256)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 2月 17 週一 202017:19
  • 如何學好python

PYTHON(109 SPRING)-3.jpg


 
文章撰寫 : 以斯帖統計顧問公司  Python課程講師 蔡勝雄老師(Amos)
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(198)

  • 個人分類:Python的應用
▲top
  • 8月 02 週二 201617:17
  • 以巨集指令以及end=eof 完成過程中有 0筆資料檔的資料循環處理

 
 健保資料分析時,會遇到循環性的資料處理步驟,以1:1個案配對(individual matching)的資料處理過程為例,1個暴露個案(cohort study 的 exposure)或1個病例個案(case-control study 中的 case)依特定條件配到1個對照個案,此時要將該對照個案從對照組的抽樣母體中扣除,再繼續找下一個exposure或case的對照個案,直到對照組的個案建立完成,因此是由巨集指令(Macro Language)的迴圈進行此連續動作。而扣除的方式是以身份證號(ID)以及生日(ID_birthday)做為關鍵變項(key variable),將被抽中者從抽樣母體中扣除,因此在對照組的抽樣母體中再也找不到該位病人的資料,因此不會被之後的exposure或case再抽中,以致相同的對照個案有重覆出現的情形。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(3,377)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 12月 01 週二 201518:03
  • Retain(累進值)的使用




(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(16,481)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 8月 06 週四 201517:43
  • 健保資料分析的獨特性與研究限制

二階段抽樣1
 
過去10年,學術界一窩蜂地以健保資料庫作為『省錢、省時、省力』的研究方法,由於過於浮濫的發表,有些學校已嚴格限制健保資料庫作為升等的題材,究竟這麼珍貴的資料庫,何以成為被學界所垢病的次級資料(secondary data),究竟這個領域的研究限制是什麼?而它獨步全球的優勢又是什麼?
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(8,903)

  • 個人分類:淺談研究設計
▲top
  • 5月 18 週一 201516:41
  • 重覆測量在生物醫學研究上的應用

DSC_00課程
 
    在臨床實驗或介入型研究,經常需要對同一個受試個體(Subject)在不同的時間點觀察其反應,當觀察的時間點只有兩個時,可以用來分析的統計方法為paired t-test;如果觀察的個體數目太少,則會建議使用相依樣本的無母數檢定方法,如:Wilcoxon signed-rank test,若反應變項為類別型資料,且資料為相依樣本的情況下,其統計檢定方法為McNemar Test。
 
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(10) 人氣(30,777)

  • 個人分類:統計分析方法簡介
▲top
  • 5月 04 週一 201519:05
  • 以PROC EXPAND程序將資料上下垂直移動


 
過去曾經介紹過以SAS的IFN(), LAG()等函數將資料向下垂直移動,但SAS可否有LAG()函數的相反函數,也就是將資料垂直向上移動的函數,答案應該是沒有的,但可透過PROC EXPAND程序執行資料的垂直向上以及向下的移動,甚至是移動數個列數,該語法屬於Time series(時間序列)的應用。
在【程式一】建立範例資料,資料中包含ID(身份證號)、sex(性別)、Birthday(生日)、date (就醫日期)。
 
【程式一】
data aa;
        input id $ sex $ birthday yymmdd10. +1 date yymmdd10.;
        format birthday date yymmdd10.;
cards;
A01 F 1958-01-04 2001-02-03
A01 F 1958-01-04 2004-05-06
A02 M 1964-07-08 2004-12-11
A02 M 1964-07-08 2005-01-03
A02 M 1964-07-08 2006-11-13 
;
proc print;
run;

 
【程式二】
以下利用proc expand 進行資料的向上與向下移動,移動後的資料檔名為work.bb,移動的依據為ID與birthday。再利用convert指定將資料作轉換,convert的指令為CONVERT variable = newname … </options>;  等號左邊放要被轉換的變項,等號右邊為轉換後的變項。透過transformout=(lag)可以將資料往下移動,transformout=(lead)則將資料往上移動。若在lag或lead後面加上數字,則是移動的列數。也可以利用id指令取代by而作為資料移動的依據,但是id指令後面只能放數值型資料,包括日期格式的資料。
 
/*-移動日期--*/
proc expand data=aa out=bb method = none; 
        by id birthday;
        convert date = date_lag1 / transformout=(lag); 
        convert date = date_lead1 / transformout=(lead); 
        convert date = date_lag2 / transformout=(lag 2); 
        convert date = date_lead2 / transformout=(lead 2); 
proc print;
run;

 
【結果】
proc_expand  
 Reference
http://goo.gl/q0mM1R
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(6,007)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 4月 28 週二 201516:34
  • 『進階存活分析』在生物醫學研究上的應用

相片2
 
傳統的存活分析方法大多用於估計單一次事件(例如:死亡,得病等)的存活率,但是在臨床研究上,有些存活資料屬於復發事件(recurrent event);例如,同一個體(subject)在追蹤時間(follow-up time)內發生多次某種症狀。以傳統的存活分析的觀點,可以僅看”第一次”復發事件的存活分析,但缺點是忽略了其他復發事件發生的訊息。所以,當資料型態是這種情形下,採用多次復發存活分析方法是較爲合適的。
 
一般的存活分析方法僅能用於資料之間爲獨立的情形下,然而,在臨床研究上,常收集到的資料是具有相關性的;例如,同一個體(subject)中的眼睛、腎臟等兩個以上的器官所收集到的存活資料。此外,同一家庭內的兩個不同個體的存活資料,亦可視爲此種資料型態。此種資料因爲具有配對的特性,所以在分析上較爲複雜,所採用的方法為配對存活分析(Matched Survival)。
 
在醫學研究中最常見的資料型態為右設限(right censored)資料,此類個案僅能記錄到從進入研究到研究截止的時間,在研究時間中止前,某些個案尚未發生感興趣的事件,所記錄的時間非真正發生事件的時間,造成資料不完整的情形。另一種常見的不完整情形爲左截切(left truncation)資料,左截切分析中,究者感興趣的是個案的存活年齡,例如65歲以後入住於老人安養院後能存活到幾歲。如果個案在研究開始前即死亡,則完全無法被觀察到,有別於右設限,左截切僅能觀察到部份的個案資料。在這種情形下,典型的Kaplan-Meier estimate是無法使用的。
 
另外。在醫學研究的實務應用中,可能存在有二種以上的不同事件,而感興趣的事件為其中一種。在這種情形下,出現某種事件可能會掩蓋了其它事件發生的可能性,此即為競爭風險(Competing Risks)。例如,針對白血病骨髓移植病患的研究,可能發生的事件有二種。白血病復發(relapse)以及移植失敗所造成的死亡(death)。如果我們要探討的是骨髓移植的復發率,移植失敗所造成的死亡(death)即為復發(relapse)的競爭風險事件(competing risk event)。所採用的方法為以累積發生函數(cumulative incidence function; CIF)來呈現特定事件在不同時間點發生的可能性。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(3,305)

  • 個人分類:統計分析方法簡介
▲top
  • 3月 24 週二 201516:31
  • SAS中的資料型態轉換─put()與input()的函數應用

 
在資料分析時,經常遇到資料格式不是我們預期的,例如日期為文字型態,因此無法計算研究對象的年齡、或與時間有關的所有日期資料,或是資料合併時,發現兩個檔的資料型態不同,以致資料無法合併。以下將簡介SAS中的PUT()與INPUT()等函數的應用。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(49,596)

  • 個人分類:SAS程式編輯武功秘笈
▲top
«123...13»

以斯帖官網

推薦熱門文章

熱門文章

  • (8,328)淺談病例交叉設計(case-crossover design)
  • (25,324)資料的水平合併(Merge)(二)
  • (126,311)ROC曲線 (Receiver Operating Characteristic Curve)
  • (9,520)健保資料庫的歸戶(人次轉人數)(二)
  • (38,588)SAS中的描述性統計: PROC MEANS指令
  • (17,595)SAS中的時間函數: INTNX( )
  • (2,121)行動者與夥伴相互依頼模式(Actor-Partner Interdependence Model, APIM)簡介
  • (7,503)群組化軌跡模式(Group-Based Trajectory Modeling, GBTM)
  • (18,221)SAS中的時間間隔的計算: INTCK('interval',from,to)
  • (22,476)SAS中的LAG()、DIF()與IFN()等函數

文章分類

  • AI人工智慧 (2)
  • Python的應用 (3)
  • 資訊分享 (6)
  • SPSS在統計上的應用 (4)
  • SigmaPlot的繪圖功能 (4)
  • R與統計分析 (4)
  • EXCEL教戰守則 (5)
  • 醫藥新聞 (8)
  • 統計分析方法簡介 (32)
  • 淺談研究設計 (16)
  • SAS程式編輯武功秘笈 (36)
  • 統計人的心靈小棧 (3)
  • 統計教學 (6)
  • 未分類文章 (1)

最新文章

  • 以統計軟體繪製死亡率地圖
  • 健保資料庫分析時,任一年出現二次特定疾病診斷碼定義研究族群,該怎麼做呢?
  • SAS程式中的array指令
  • SAS中的printto指令
  • 統計的變數型態-定量變數
  • 統計的變數型態-類別變數
  • 深度學習之- 時間序列
  • 深度學習之--迴歸與分類
  • 藥物流行病學中的immortal time bias
  • Python環境建置

留言板

文章精選

參觀人氣

  • 本日人氣:
  • 累積人氣:

以斯帖統計LINE

以斯帖統計LINE