以下為簡易的Dummy variable(虛擬變項)的建立,在回歸分析中,當解釋變數為類別型資料,例如藥物的濃度分為4類,其中一類為參考組,則每一組將與參考組作比較,比較的組數有3組。在回歸模式中不能直接放該類別變項(CON_GRP),否則會視同連續型資料。

因此需要設3Dummy variable,例如以下程式的CON_1~CON_3,當3個變項為0(0,0,0),該組為參考組,當CON_11(1,0,0),為第一組與參考組間的比較,其他以此類推。而Dummy variable的程式語法如[程式一]CON_GRP=1時,CON_1=1CON_GRP=2時,CON_2=1CON_GRP=3時,CON_3=1,其他非1的數值,自動生成為0

[程式一]

data aa1;
set aa;
CON_1=(CON_GRP=1); /*Dummy variable*/
CON_2=(CON_GRP=2);
CON_3=(CON_GRP=3);
run;

檢查Dummy variable設定的結果。

[程式二]
proc freq data=aa1;
tables AE* CON_GRP*CON_1* CON_2*CON_3/list;
run;

dummy variable  

 

 

文章標籤
創作者介紹
創作者 estat 的頭像
estat

blog.estat.com.tw

estat 發表在 痞客邦 留言(0) 人氣()