On peut démontrer qu'un réseau de neurones ayant que des neurones linéaires avec une couche cachée à m unités (où m représente la dimension de l'analyse discriminante) peut être assimilé à une analyse discriminante sur la première couche.
On va donc ici voir ce que font les réseaux neuronaux et comparer les résultats à l'analyse discriminante.
Notre variable qualitative à expliquer est à 5 modalités. Nous allons donc considérer un réseau à 5 variables dans la couche cachée.
Les variables d'entrée sont mises dans le tableau ``vexp'' et la variable à expliquer est nommée ``vpart''.
Le logiciel Splus nous donne les résultats suivants :
> res2_nnet(vexp,vpart,size=5,decay=0,linout=T,maxit=1000) # weights: 91 initial value 531.549007 final value 75.246429 converged > varron_round(predict(res2,vexp),digits=0) [1,] 3 3 1 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 [1,] 3 3 3 3 3 3 3 3 1 1 1 3 3 3 3 4 1 3 4 3 3 3 3 3 [1,] 3 3 1 1 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 1 3 3 3 3 [1,] 3 3 3 3 3 3 3 > vpart [1] 3 1 2 3 1 2 2 2 2 3 1 2 3 3 2 3 1 1 3 3 3 3 3 3 2 1 3 3 3 3 5 5 1 1 5 2 1 1 [39] 1 3 1 4 4 1 4 4 3 2 3 4 1 3 4 2 1 1 2 2 2 2 1 3 2 3 3 2 3 2 4 4 1 3 4 3 3 3 [77] 3 1 3 3 3 3D'après les sorties, on voit que 40 individus sur 82 sont mal reclassés ; ce qui correspond quand même à la moitié de la population.
On voit donc que les résultats fournis par l'analyse discriminante sont meilleurs.
Remarquons qu'en changeant la valeur du paramètre decay, les résultats changent mais pas énormément à savoir qu'il y a un ou deux individus de plus ou de moins dans la population des mal classés.