La régression logistique a été effectuée en utilisant la procédure ``genmod'' du logiciel SAS. Le programme est le suivant :
data val2; set sasuser.val; filiere=filiere-1; sexe=sexe-1; run; proc genmod data=val2; class sexe; model filiere = sexe sc1 sc2 sc3 sc4 sc5 / link=logit waldci type3; run;Ici, la table ``val'' contient le fichier de données et la table ``val2'' correspond à la table où les variables sexe et filière sont codées 0 ou 1 au lieu de 1 ou 2.
Nous avons, à l'issu de ce programme, obtenus les résultats suivants :
Analysis Of Parameter Estimates Parameter DF Estimate Std Err ChiSquare Pr>Chi INTERCEPT 1 -1.3014 0.1519 73.4197 0.0001 SEXE 0.00 1 1.2240 0.3117 15.4223 0.0001 SEXE 1.00 0 0.0000 0.0000 . . SC1 1 0.0019 0.0004 20.4468 0.0001 SC2 1 0.0001 0.0004 0.0288 0.8652 SC3 1 -0.0018 0.0005 14.1590 0.0002 SC4 1 -0.0013 0.0005 6.6488 0.0099 SC5 1 0.0009 0.0005 3.6411 0.0564 SCALE 1 0.4052 0.0142 . . NOTE: The scale parameter was estimated by maximum likelihood.On voit ainsi que le score 2 (SC2) n'est pas du tout significatif à 5%. On décide donc de la supprimer.
Analysis Of Parameter Estimates Parameter DF Estimate Std Err ChiSquare Pr>Chi INTERCEPT 1 -1.2985 0.1506 74.3793 0.0001 SEXE 0.00 1 1.2137 0.3051 15.8246 0.0001 SEXE 1.00 0 0.0000 0.0000 . . SC1 1 0.0019 0.0004 20.4816 0.0001 SC3 1 -0.0018 0.0005 14.1465 0.0002 SC4 1 -0.0014 0.0005 6.7501 0.0094 SC5 1 0.0009 0.0005 3.6259 0.0569 SCALE 1 0.4052 0.0142 . .
A 5%, on enlève aussi la variable SC5. On obtient finalement le modèle suivant :
Parameter DF Estimate Std Err ChiSquare Pr>Chi INTERCEPT 1 -1.2939 0.1519 72.5109 0.0001 SEXE 0.00 1 1.2540 0.3058 16.8143 0.0001 SEXE 1.00 0 0.0000 0.0000 . . SC1 1 0.0018 0.0004 19.6101 0.0001 SC3 1 -0.0018 0.0005 14.5947 0.0001 SC4 1 -0.0013 0.0005 6.2643 0.0123 SCALE 1 0.4071 0.0143 . .Ainsi, les seules variables qui interviennent dans l'explication de la variable filière sont le sexe et les 3 scores SC1, SC3 et SC4.