next up previous contents
Next: Comparaison avec les réseaux Up: Comparaison de la régression Previous: Travail à effectuer

Régression logistique de la filière sur les autres variables

La régression logistique a été effectuée en utilisant la procédure ``genmod'' du logiciel SAS. Le programme est le suivant :

data val2;
set sasuser.val;
filiere=filiere-1;
sexe=sexe-1;
run;
proc genmod data=val2;
class sexe;
model filiere = sexe sc1 sc2 sc3 sc4 sc5 
                / link=logit waldci type3;
run;
Ici, la table ``val'' contient le fichier de données et la table ``val2'' correspond à la table où les variables sexe et filière sont codées 0 ou 1 au lieu de 1 ou 2.

Nous avons, à l'issu de ce programme, obtenus les résultats suivants :

                      Analysis Of Parameter Estimates

     Parameter          DF    Estimate     Std Err   ChiSquare  Pr>Chi

     INTERCEPT           1     -1.3014      0.1519     73.4197  0.0001
     SEXE       0.00     1      1.2240      0.3117     15.4223  0.0001
     SEXE       1.00     0      0.0000      0.0000           .       .
     SC1                 1      0.0019      0.0004     20.4468  0.0001
     SC2                 1      0.0001      0.0004      0.0288  0.8652
     SC3                 1     -0.0018      0.0005     14.1590  0.0002
     SC4                 1     -0.0013      0.0005      6.6488  0.0099
     SC5                 1      0.0009      0.0005      3.6411  0.0564
     SCALE               1      0.4052      0.0142           .       .

NOTE:  The scale parameter was estimated by maximum likelihood.
On voit ainsi que le score 2 (SC2) n'est pas du tout significatif à 5%. On décide donc de la supprimer.
On relance la procédure ``genmod'' sans cette variable et on obtient :

                      Analysis Of Parameter Estimates

     Parameter          DF    Estimate     Std Err   ChiSquare  Pr>Chi

     INTERCEPT           1     -1.2985      0.1506     74.3793  0.0001
     SEXE       0.00     1      1.2137      0.3051     15.8246  0.0001
     SEXE       1.00     0      0.0000      0.0000           .       .
     SC1                 1      0.0019      0.0004     20.4816  0.0001
     SC3                 1     -0.0018      0.0005     14.1465  0.0002
     SC4                 1     -0.0014      0.0005      6.7501  0.0094
     SC5                 1      0.0009      0.0005      3.6259  0.0569
     SCALE               1      0.4052      0.0142           .       .

A 5%, on enlève aussi la variable SC5. On obtient finalement le modèle suivant :

     Parameter          DF    Estimate     Std Err   ChiSquare  Pr>Chi

     INTERCEPT           1     -1.2939      0.1519     72.5109  0.0001
     SEXE       0.00     1      1.2540      0.3058     16.8143  0.0001
     SEXE       1.00     0      0.0000      0.0000           .       .
     SC1                 1      0.0018      0.0004     19.6101  0.0001
     SC3                 1     -0.0018      0.0005     14.5947  0.0001
     SC4                 1     -0.0013      0.0005      6.2643  0.0123
     SCALE               1      0.4071      0.0143           .       .
Ainsi, les seules variables qui interviennent dans l'explication de la variable filière sont le sexe et les 3 scores SC1, SC3 et SC4.



Yasmine yactine
1999-07-28