以下為簡易的Dummy variable(虛擬變項)的建立,在回歸分析中,當解釋變數為類別型資料,例如藥物的濃度分為4類,其中一類為參考組,則每一組將與參考組作比較,比較的組數有3組。在回歸模式中不能直接放該類別變項(CON_GRP),否則會視同連續型資料。
因此需要設3個Dummy variable,例如以下程式的CON_1~CON_3,當3個變項為0時(0,0,0),該組為參考組,當CON_1為1時(1,0,0),為第一組與參考組間的比較,其他以此類推。而Dummy variable的程式語法如[程式一],CON_GRP=1時,CON_1=1;CON_GRP=2時,CON_2=1;CON_GRP=3時,CON_3=1,其他非1的數值,自動生成為0。
[程式一]
data aa1;
set aa;
CON_1=(CON_GRP=1); /*Dummy variable*/
CON_2=(CON_GRP=2);
CON_3=(CON_GRP=3);
run;