PIXNET Logo登入

以斯帖統計顧問公司

跳到主文

面對複雜的統計分析,是否感到不知所措?『以斯帖統計顧問公司』能幫您擷取最有價值的資訊。本公司的主要服務項目為統計教學、統計諮詢,並承接公家機關、國內外藥廠、醫院的研究委託案,數年來已累積大量的服務群,也深受許多好評。

部落格全站分類:不設分類

  • 相簿
  • 部落格
  • 留言
  • 名片
  • 1月 21 週二 201418:58
  • 資料的水平合併(Merge)(三)


 
健保資料庫的資料處理過程有許多資料合併的步驟,可知道您在合併什麼嗎?過去常有人問門診檔與住院檔要怎麼合併?用SET?還是用MERGE?其實要看您的研究目的,以及您要合併的檔案內容。無論用什麼方式,或選用什麼樣的軟體,合併前必須注意三件事,首先要注意串聯兩個檔的關鍵變項(KEY VARIABLE)之名稱、屬性(文字、數值、日期)、資料寬度是否一致,其次,兩個檔案間是否還有除了關鍵變項以外,名稱與屬性一樣的變項,它會干擾合併的結果。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(3,807)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 1月 21 週二 201418:47
  • 資料的水平合併(Merge)(二)


   
在分析健保資料庫時,資料的合併是一個很重要的過程,但往往出錯的地方也是在此,今日要以數學「集合」的觀念來探討資料的合併,曾經有醫師抱怨這個部份很難懂,若以圖像的方式來解說,那麼就可一目瞭然了。
首先,利用 [程式一] 與 [程式二]寫入一組資料檔,第一組的檔名為aa,第二組的檔名為bb。利用INPUT指令放入一個變項 ID,"$"符號說明ID屬於文字變項,@@宣告即將輸入一列多筆的資料。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(1) 人氣(25,338)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 1月 21 週二 201418:19
  • 大批資料的垂直合併


 
當我們將大批有規律的檔名讀進來,並經由巨集指令(Macro language)轉換成流水號形式的檔名,但最終還是要將每一個檔合併起來,若不以巨集指令合併檔案,傳統的作法即如[程式一]所示,利用SET語法將468個檔案合併起來,利用DATA指令宣告新的檔名為e.cd,因此需要把檔名書寫468次,過程必須如屢薄冰般的謹慎。今日將以巨集指令的兩個範例─[程式二]與[程式三],示範大批資料的合併。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(2) 人氣(6,333)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 1月 21 週二 201418:15
  • 淺談病例交叉設計(case-crossover design)

 
病例交叉設計可以說是病例對照設計(case-control design)及交叉設計(crossover design)的綜合體,它兼具了上述兩種設計方式的特性。此外,一般來說,世代研究(cohort study)在實行時所面臨的難題,是如何選擇一個可進行比較的對照組。而在病例交叉研究中,每一個體(subject)可做為他自己的對照組。只有那些個體發生特定事件(亦即病例組),且同時於特定事件發生日期前的某段時間內有接觸過特定治療(treatment),才可以納入試驗的個案中。相同個體在治療結果發生前較短時間(case period)接觸過特定治療之勝算(odds),會與特定結果發生前較久時間(control period)有接觸過特定治療勝算(odds)相比較,以計算出勝算比(odds ratio; OR)來解釋最後的研究發現。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(8,342)

  • 個人分類:淺談研究設計
▲top
  • 1月 21 週二 201417:46
  • 如何利用巨集指令讀取「衛生福利資料科學中心」之龐大資料群


過去已介紹檔案間沒有關鍵字將如何合併?(資料的合併)利用該程式,今日要教各位如何讀取大批命名有規律的檔。
自「全民健康保險研究資料庫」釋出後,大型資料的研究已是台灣學術研究的優勢,在國際學術期刊上已有亮麗成績,「衛生福利資料科學中心」如今亦開放健保資料庫、癌症登記檔與死亡檔的資料比對,但面對全國性的龐大資料檔,光是讀檔案的步驟,就是惱人的大工程。不用著急,也毋需土法煉鋼,今天的程式可以讓大家以後讀檔更輕鬆了。
以下將以讀取「衛生福利資料科學中心」之健保民國87-99年「門診處方及治療明細檔」為例,其中一個檔名為h_nhi_opdte8702_01。如何拆解這個檔名呢?h_nhi_opdte 在龐大的檔案群是固定的,87為年份,02為月份,01為西醫(02、03為牙醫與中醫),因此所有檔案讀進來,一年有36個檔,13年有468個檔,如何讀取這麼龐大的檔案群呢?
[程式一] 利用程式寫入3個資料檔,第一個資料檔檔名為year,僅放入民國年資料;第二個資料檔檔名為month,僅放入月份資料;第三個資料檔檔名為group,僅放入醫療型態(西醫、牙醫、中醫)資料。
[
程式一]
data year;
input year $ @@;
cards;
87 88 89 90 91 92 93 94 95 96 97 98 99
;
run;
data month ;
input month $ @@;
cards;
01 02 03 04 05 06 07 08 09 10 11 12
;
run;
data group;
input group $ @@;
cards;
01 02 03
;
run;

將檔案建立後,利用SQL(結構式查詢語言)程式,可以將三個沒有關鍵字的檔案合併起來,檔名為ym,產生468筆資料檔。[見程式二]
[程式二]
proc sql;
create table ym as
select *
from year, month,group;
quit;

利用累加語法no+1,將每一筆資料編上1~468的流水號。其中,no的起始值(initial)是0,第一筆資料即為0+1=1,接下來依序為1+1、2+1、3+1…,每一個編號對應至一個年份、月份與醫療型態(西醫、牙醫、中醫)。若能將這些複雜的檔名讀取後,並轉為流水號型式的檔案,每當要取用資料檔時,就可以輕易用迴圈讀取了,在資料合併的過程,也變得相當簡單。例如以迴圈從468個檔擷取所要的特定疾病,新的資料檔的檔名為cd1-cd468,再以set cd1-cd468;語法將這468個檔案合併起來,而得到13年間所有研究所關心的特定疾病。  [見程式三]
[程式三]
data aa;
set ym;
no+1;
run;
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(1) 人氣(4,102)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 1月 21 週二 201417:26
  • 資料的水平合併(Merge)(一)


 
當資料合併時必須要有一組關鍵字(KEY WORD)存在於每一個欲合併起來的檔案中,但沒有關鍵字時結果將如何?
舉以下的例子來聊聊
以下有一個經過3個資料檔合併後的檔案,這3個檔各只有一個變項: year(87~99), month(01~12), group(10~30),且3個檔的內容完全不同
但彼此間沒有關鍵字。過去我們將會寫以下這麼一隻程式(如程式一),如下所示, 其中合併後的檔案為ymg,3個檔案的檔名依序為year, month, group,結果資料合併後如結果一。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(3,927)

  • 個人分類:SAS程式編輯武功秘笈
▲top
  • 1月 21 週二 201417:22
  • 從一張黑膠唱盤尋找逝去的民國六十年

DSC08308
  

這個週末,筆者無意間在公館發現了一間藏身在地下室的二手書店,順著樓梯往下,撲鼻的霉味有點讓人難受,但走進店門的那一刻,內心卻興奮無比,這別有洞天的一番小天地裡,竟有這麼多過時的黑膠唱盤、光碟與書報雜誌,於是迫不及待地在架上找尋過往的回憶。
在一排又一排紙套皆有些微甚至嚴重泡水或磨損的黑膠唱片前,發現了一張民國六十年的黑膠唱盤,封面是六個穿著水手裝的可愛小女孩,背景是台北松山機場,而唱片主打的是:『兒童歌曲─國民小學教育唱片』。筆者看著封面沉思許久,多希望有『多拉A夢』的時光機穿越到那個動盪不安卻又淳樸可愛的年代。
民國六十年,在政治上,會讓人聯想起白色恐怖時代(指1949年至1987年間),當時為了防止中國共產黨在台灣擴散且為鞏固當權者統治地位,國家公權力受到濫用,導致許多人成為無辜犧牲者。政治也強力介入了教育,民國五十九年八月二十四日,教育部通過「光復大陸教育重建綱要」,教育的重點,在於清除共產主義思想的毒素,重建倫理、民主、科學的三民主義文化(中華百科全書)。筆者的小學生活也經歷過寫作或朗讀時,對國家歌功頌德,對共產主義大張撻伐就能得高分的年代。
於是我翻到唱片的背面,此專輯共有4輯,在72首歌當中,共收錄了9首反共愛國歌曲,包括:國歌、國旗歌、國慶歌、國父紀念歌、領袖歌、反共復國歌、我中華、建設我中華、一起上戰場。
這些歌,對當今連國歌都不會唱的孩子,是難以想像的外星語言,遑論去想像民國六十年的政治局勢與生活氛圍。
民國六十年,當時的總統為第五任的蔣中正,行政院長為蔣經國,那是一個將領袖神格化的年代,『介壽』與『中正』等字眼出現在台灣的大街小巷,以及機關學校。這一年,對中華民國而言,是一個極具影響且動盪的一年,因為我們退出了『聯合國』,且失去國際上重要的盟友;對台灣而言,是加速工業化發展的年代,人口開始由農村外移到都市,重要的事件如下:
8
月14日─台灣中山高速公路動工
8
月28日─台灣掀起「保釣運動」
10
月25日─聯合國大會2758號決議通過,承認中華人民共和國為中國代表,會員名稱仍為中華民國,並將蔣介石代表驅逐出聯合國。
10
月31日─中華民國第三家無線電視台中華電視台正式開播。(維基百科)
而電視在這個年代是個新奇的產物,也是昂貴的奢侈品。當時電視剛從黑白轉為彩色,電視也取代了廣播、電影成為台灣民眾最主要的生活娛樂。到鄰居家看電視是那個世代的共同回憶,一起挨在電視機前看少棒比賽,一起吃點心,一起叫罵歡呼,一起從國際政治的低迷情勢尋找民族的自尊,一起看楊麗花演歌仔戲。大同公司隨機附贈的「大同寶寶」,也才問世不久,如今成了動輒上千的珍貴收藏品。
當時眷村的房子是一戶緊接一戶的,緊緊相連,鄰居間的感情也濃厚得化不開。那時的孩子會跟鄰居一起玩樂,玩彈珠、跳繩、皮球、躲避球、捉迷藏、竹蜻蜓,還有紙牌(台語稱為尪仔標),而女孩們玩辦家家酒。現在的孩子,只剩自己在電腦桌前玩虛擬遊戲,玩到人際疏離,作息錯亂。
民國六十年,國內尚無一家統計學研究所的設立,就連中央研究院的「統計科學研究所」也是在九年後才進入籌備階段,此時統計學才正要從各個學科中獨立出來,可以想見統計學在當時的台灣尚屬起步階段。
當時的人口統計,總人口1507萬人、出生人口38萬人、死亡人口7萬人,年齡中位數為19.7歲、老年人口扶養比為5.2人。比照99年的統計數據,總人口2316萬人、出生人口16.7萬人、死亡人口14.6萬人,年齡中位數為37.4歲、老年人口扶養比為14.6人。
兩個世代的比較中,如今生育率明顯地下降,人口也顯著地老化,少子化的結果,年輕一輩的肩頭更加沉重;兩岸已經直航,國共對立已不再明顯,反共復國也不再是時代使命;資訊不僅爆炸,資訊帶來的便利使人們的一動一靜都在雲端上默默地記錄著;眷村成了博物館,在參天的建物群中,給都市人一個懷舊的出口;都會人的居住空間更為狹小了,但老死不相往來的鄰居互動已成常態,而眷村人濃得化不開的革命情誼早已成為風中往事。
一張黑膠唱盤,不僅是一張時代的產物,更勾起了一段風起雲湧的大時代,以及社會底層小人物的幽幽往事。走筆至此,不禁望著這張只能欣賞卻無機器可以播放的唱盤一眼,心中喟嘆時代快速的變遷,而唱盤封面的小女孩早已卸下反共教育的使命,如今都已成為年華已逝的老嫗。
在手機通訊極為便利的時代,我們擁有更多的民主自由,更多的科技享樂,然而面對二十一世紀的另一波大時代,以及這時代下的高物價、高疏離、低收入、低成就,在許多人心中,恐怕正一筆一筆地刻劃著心中的無奈與不安。面對時代的挑戰,我們需要這時代不一樣的勇氣與這時代獨有的信心。
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(338)

  • 個人分類:統計人的心靈小棧
▲top
  • 1月 21 週二 201416:50
  • 她的暗夜哭泣,統計,有時也愛莫能助

 
冬-統計幫不上的忙2  
版權: 以斯帖統計顧問公司/繪圖: 林子傑
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(0) 人氣(1,788)

  • 個人分類:統計人的心靈小棧
▲top
  • 1月 21 週二 201414:38
  • 如何使用多重死因資料發表SCI論文?

多重死因資料分析工作坊 2014

       
如何使用多重死因資料發表SCI論文?
沒有論文發表壓力者請勿報名!
(繼續閱讀...)
文章標籤

estat 發表在 痞客邦 留言(2) 人氣(275)

  • 個人分類:統計教學
▲top
«1...1213

以斯帖官網

推薦熱門文章

熱門文章

  • (126,337)ROC曲線 (Receiver Operating Characteristic Curve)
  • (38,608)SAS中的描述性統計: PROC MEANS指令
  • (25,338)資料的水平合併(Merge)(二)
  • (23,380)交叉試驗(Crossover trial)
  • (22,492)SAS中的LAG()、DIF()與IFN()等函數
  • (18,237)SAS中的時間間隔的計算: INTCK('interval',from,to)
  • (17,605)SAS中的時間函數: INTNX( )
  • (9,535)健保資料庫的歸戶(人次轉人數)(二)
  • (8,342)淺談病例交叉設計(case-crossover design)
  • (7,521)群組化軌跡模式(Group-Based Trajectory Modeling, GBTM)

文章分類

  • AI人工智慧 (2)
  • Python的應用 (3)
  • 資訊分享 (6)
  • SPSS在統計上的應用 (4)
  • SigmaPlot的繪圖功能 (4)
  • R與統計分析 (4)
  • EXCEL教戰守則 (5)
  • 醫藥新聞 (8)
  • 統計分析方法簡介 (32)
  • 淺談研究設計 (16)
  • SAS程式編輯武功秘笈 (36)
  • 統計人的心靈小棧 (3)
  • 統計教學 (6)
  • 未分類文章 (1)

最新文章

  • 以統計軟體繪製死亡率地圖
  • 健保資料庫分析時,任一年出現二次特定疾病診斷碼定義研究族群,該怎麼做呢?
  • SAS程式中的array指令
  • SAS中的printto指令
  • 統計的變數型態-定量變數
  • 統計的變數型態-類別變數
  • 深度學習之- 時間序列
  • 深度學習之--迴歸與分類
  • 藥物流行病學中的immortal time bias
  • Python環境建置

留言板

最新留言

  • [25/04/28] 訪客 於文章「深度學習之--迴歸與分類...」留言:
    你好!有什麼我可以幫忙的嗎? 我是部落客流量商 也可以看...
  • [24/05/07] 學生 於文章「SAS中的first.variable與...」留言:
    請問 就醫記錄 同一個人同一天被記錄2次(診斷有特定疾病),...
  • [23/03/30] 訪客 於文章「資料的水平合併(Merge)(二)...」留言:
    太感謝你們把這篇文章的內容放上來、拯救遇到跑健保資料庫遇到障...
  • [22/04/26] 訪客 於文章「相關係數的呈現----斯皮爾曼(Spea...」留言:
    原本在搜尋引擎找出一堆 Blog 文章,不知哪幾篇值得花時間...
  • [22/02/15] 英文編修潤稿 於文章「多中心臨床試驗之分析(Multicent...」留言:
    如何為論文定合適的標題? 歡迎訂閱Uni-edit學術論文寫...
  • [21/12/30] 康藥本鋪 kmed.tw 於文章「相關係數的呈現----斯皮爾曼(Spea...」留言:
    新聞BLOG https://kmed.tw/ind...
  • [21/02/23] estat 於文章「交叉試驗(Crossover trial...」留言:
    washout確實是沖洗、清洗、洗滌的意思,在此,它當然可以...
  • [21/02/23] 訪客 於文章「交叉試驗(Crossover trial...」留言:
    洗滌期間(washout period) 明明就是排空期 媽...
  • [20/06/13] 吳涵 於文章「相關係數的呈現----斯皮爾曼(Spea...」發表了一則私密留言
  • [20/06/04] 英文編修潤稿 於文章「如何使用多重死因資料發表SCI論文?...」留言:
    Uni-edit 論文英文編修服務,將分享Uni-edit ...

文章精選

參觀人氣

  • 本日人氣:
  • 累積人氣:

以斯帖統計LINE

以斯帖統計LINE