Analyse en Composantes Principales

Code source

Quand l’utiliser ?

Méthode de description graphique de variables quantitatives

Étape 1 : lecture du jeu de données

Importer le jeu de données

Le jeu de données data ne contient que des variables quantitatives sauf la première colonne nommée id qui contient les identifiants

Utiliser le jeu de données :

attach(data)

Lier les id aux lignes :

rownames(data) = data$id
data = data[,-1]

Étape 2 : description des données

Informations sur les données :

summary(data)

Étape 3 : analyse du jeu de données

Charger la librairie ade4

Calcul de l’ACP

acp = dudi.pca(data)

Sélectionner le nombre d’axes qui permet de représenter environ 70 % du jeu de données

Choix du nombre d’axes

inertia.dudi(acp)

On garde le nombre d’axe qui représente au moins 70 % du jeu de données

Nouveau calcul de l’ACP en sélectionnant le nombre exact d’axes :

acp = dudi.pca(data)

Coordonnées dans le nouveau référentiel

Coordonnées des variables :

acp$co

Coordonnées des individus :

acp$li

Graphiques

Cercles de corrélation (exemple avec 2 axes principaux) :

s.corcircle(acp$co,xax = 1,yax = 2)

Projection des individus et des variables sur un graphique commun :

s.label(acp$li,xax=1,yax=2)
s.arrow(3*acp$co,xax=1,yax=2,add.plot = TRUE)

Étape 4 : étude des contributions

Contribution des variables à la construction des axes :

inertia.dudi(acp,col=T,row=T)$col.abs

Contribution des individus à la construction des axes :

inertia.dudi(acp,col=T,row=T)$row.abs

Étape 5 : étude des qualités

Qualité de la représentation des variables sur les axes :

inertia.dudi(acp,col=T,row=T)$col.rel

Qualité de la représentation des individus sur les axes :

inertia.dudi(acp,col=T,row=T)$row.rel

Plan