Analyse en Composantes Principales
Quand l’utiliser ?
Méthode de description graphique de variables quantitatives
Étape 1 : lecture du jeu de données
Importer le jeu de données
Le jeu de données data ne contient que des variables quantitatives sauf la première colonne nommée id qui contient les identifiants
Utiliser le jeu de données :
attach(data)
Lier les id aux lignes :
rownames(data) = data$id
data = data[,-1]
Étape 2 : description des données
Informations sur les données :
summary(data)
Étape 3 : analyse du jeu de données
Charger la librairie ade4
Calcul de l’ACP
acp = dudi.pca(data)
Sélectionner le nombre d’axes qui permet de représenter environ 70 % du jeu de données
Choix du nombre d’axes
inertia.dudi(acp)
On garde le nombre d’axe qui représente au moins 70 % du jeu de données
Nouveau calcul de l’ACP en sélectionnant le nombre exact d’axes :
acp = dudi.pca(data)
Coordonnées dans le nouveau référentiel
Coordonnées des variables :
acp$co
Coordonnées des individus :
acp$li
Graphiques
Cercles de corrélation (exemple avec 2 axes principaux) :
s.corcircle(acp$co,xax = 1,yax = 2)
Projection des individus et des variables sur un graphique commun :
s.label(acp$li,xax=1,yax=2)
s.arrow(3*acp$co,xax=1,yax=2,add.plot = TRUE)
Étape 4 : étude des contributions
Contribution des variables à la construction des axes :
inertia.dudi(acp,col=T,row=T)$col.abs
Contribution des individus à la construction des axes :
inertia.dudi(acp,col=T,row=T)$row.abs
Étape 5 : étude des qualités
Qualité de la représentation des variables sur les axes :
inertia.dudi(acp,col=T,row=T)$col.rel
Qualité de la représentation des individus sur les axes :
inertia.dudi(acp,col=T,row=T)$row.rel
← Plan