12.1 Aperçu des méthodes factorielles

12.1.1 Méthodes factorielles et types de données

En analyse factorielle, la nature même des données du tableau à traiter détermine la méthode à employer : l’analyse en composantes principales (ACP) est adaptée aux tableaux avec des variables continues (idéalement normalement distribuées), l’analyse factorielle des correspondances (AFC) s’applique à des tableaux de contingence tandis que l’analyse des correspondances multiples (ACM) permet de résumer des tableaux avec des données qualitatives (issues d’un sondage par exemple) (tableau 12.1). Sachez toutefois qu’il existe d’autres méthodes factorielles qui ne sont pas abordées dans ce chapitre, notamment : l’analyse factorielle de données mixtes (AFDM) permettant d’explorer des tableaux avec à la fois des variables continues et des variables qualitatives et l’analyse factorielle multiple hiérarchique (AFMH) permettant de traiter des tableaux avec une structure hiérarchique. Pour s’initier à ces deux autres méthodes factorielles plus récentes, consultez notamment l’excellent ouvrage de Jérôme Pagès (2013).

Tableau 12.1: Trois principales méthodes factorielles
Méthode factorielle Abr. Type de données Type de distance
Analyse en composantes principales ACP Variables continues Distance euclidienne
Analyse factorielle des correspondances AFC Tableau de contingence Distance du khi-deux
Analyse factorielle des correspondances multiples ACM Variables qualitatives Distance du khi-deux

12.1.2 Bref historique des méthodes factorielles

Il existe une longue tradition de l’utilisation des méthodes factorielles dans le monde universitaire francophone puisque plusieurs d’entre elles ont été proposées par des statisticiens et des statisticiennes francophones à partir des années 1960. L’analyse en composantes principales (ACP) a été proposée dès les années 1930 par le statisticien américain Harold Hotelling (1933). En revanche, l’analyse des correspondances (AFC) et son extension, l’analyse des correspondances multiples (ACM), ont été proposées par le statisticien français Jean-Paul Benzécri (1973), tandis que l’analyse factorielle de données mixtes (AFDM) a été proposée par Brigitte Escofier et Jérôme Pagès (Escofier 1979; Pagès 2002).

Ainsi, plusieurs ouvrages de statistique sur les méthodes factorielles, désormais classiques, ont été publiés en français (Benzécri 1973; Escofier et Pagès 1998; Lebart, Morineau et Piron 1995; Pagès 2013). Ils méritent grandement d’être consultés, notamment pour mieux comprendre les formulations mathématiques (matricielles et géométriques) de ces méthodes. À cela s’ajoutent plusieurs ouvrages visant à « vulgariser ces méthodes » en sciences sociales; c’est notamment le cas de l’excellent ouvrage de Léna Sanders (1989) en géographie.

Références

Benzécri, Jean-Paul. 1973. L’analyse des données. Tome 1. La taxinomie. Tome 2. L’analyse des correspondances. Vol. 2. Dunod.

Escofier, Brigitte. 1979. « Traitement simultané de variables qualitatives et quantitatives en analyse factorielle ». Cahiers de l’Analyse des Données 4 (2): 137‑146.

Escofier, Brigitte et Jérôme Pagès. 1998. « Analyses factorielles simples et multiples ». Dunod, Paris.

Hotelling, Harold. 1933. « Analysis of a complex of statistical variables into principal components ». Journal of educational psychology 24 (6): 417. https://psycnet.apa.org/doi/10.1037/h0071325.

Lebart, Ludovic, Alain Morineau et Marie Piron. 1995. Statistique exploratoire multidimensionnelle. Dunod.

Pagès, Jérôme. 2002. « Analyse factorielle multiple appliquée aux variables qualitatives et aux données mixtes ». Revue de statistique appliquée 50 (4): 5‑37.

Pagès, Jérôme. 2013. Analyse factorielle multiple avec R. EDP sciences.

Sanders, Lena. 1989. L’analyse statistique des données en géographie. GIP Reclus.