5.1 Construction de tableau de contingence

Les données du tableau de contingence suivant décrivent 279 projets d’habitation à loyer modique (HLM) dans l’ancienne ville de Montréal, croisant les modalités de la période de construction (en colonne) et de la taille (en ligne) des projets HLM (Apparicio 2002). Les différents éléments du tableau sont décrits ci-dessous.

  • Les fréquences observées (Count au tableau ci-dessous), nommées communément \(f_{ij}\), correspondent aux observations appartenant à la fois à la ie modalité de la variable en ligne et à la je modalité de la variable en colonne. À titre d’exemple, nous comptons 14 projets HLM construits entre 1985 et 1989 comprenant moins de 25 logements.

  • Les marges du tableau sont les totaux pour chaque modalité en ligne (\(n_{i.}\)) et en colonne (\(n_{j.}\)). En guise d’exemple, sur les 279 projets HLM, 53 comprennent de 25 à 49 logements et 56 ont été construites entre 1968 et 1974. Bien entendu, la somme des marges en ligne (\(n_{i.}\)) est égale au nombre total d’observations (\(n_{ij}\)), tout comme la somme de marges en colonne (\(n_{.j}\)).

  • Trois pourcentages sont disponibles (total, en ligne, en colonne; Total Percent, Row Percent et Column Percent au tableau ci-dessous). Ils sont respectivement la fréquence observée divisée par le nombre d’observations (\(f_{ij}/n_{ij}\times100\)), par la marge en ligne (\(f_{ij}/n_{i.} \times 100\)) et en colonne (\(f_{ij}/n_{.j}\times100\)). En guise d’exemple, 5 % des 279 projets HLM ont été construites entre 1985 et 1989 et comprennent moins de 25 logements (pourcentage total, soit 14 / 279 × 100). Aussi, plus de la moitié des habitations de moins de 25 logements ont été construits entre 1990 et 1994 (pourcentage en ligne, 41 / 80× 100). Finalement, près de 36 % des logements construits avant 1975 ont 100 logements et plus (20 / 56 × 100).

  • Les fréquences théoriques (Expected Values au tableau ci-dessous), représentent les valeurs que l’on devrait observer théoriquement s’il y avait indépendance entre les modalités des deux variables; autrement dit, si la répartition des deux modalités des deux variables était dû au hasard. Pour le croisement de deux modalités, la fréquence théorique est égale au produit des marges divisé par le nombre total d’observations (\(ft_{ij} = (n_{i.}n_{.j})/n_{ij}\)). Par exemple, la fréquence théorique pour le croisement des modalités moins de 25 logements et avant 1975 est égale à : (80 × 56) / 279 = 16,06. Nous observons ici que la valeur théorique (16,06) est bien supérieure à la valeur réelle (6). Nous avons donc moins de projets HLM de moins de 25 logements avant 1975 à quoi nous pourrions nous attendre du hasard.

  • La déviation (Residual au tableau ci-dessous) est la différence entre la fréquence observée et la fréquence théorique (\(f_{ij}-ft_{ij}\)). Plus la déviation est grande, plus nous nous écartons d’une situation d’indépendance entre les deux modalités i et j. La somme des déviations sur une ligne ou sur une colonne est nulle. Si la déviation ij est nulle, la fréquence théorique est égale à la fréquence observée, ce qui signifie qu’il y a indépendance entre les modalités i et j. Une déviation positive traduit, quant à elle, une attraction entre les modalités i et j ou, autrement dit, une surreprésentation du phénomène ij; tandis qu’une déviation négative renvoie à une répulsion entre les modalités i et j, soit une sous-représentation du phénomène ij. Dans le cas précédent, nous observions six habitations de moins de 25 logements construits avant 1975 et une fréquence théorique de 16,06. La déviation est donc -10,06, soit une sous-représentation du phénomène.

  • La contribution au khi-deux (Chi-square contribution au tableau ci-dessous) est égale à la déviation au carré divisée par la fréquence théorique : \(\chi_{ij}^2 = (f_{ij}-ft_{ij})^2/ft_{ij}\). Plus sa valeur est forte, plus il y a association entre les deux modalités. La somme des contributions au khi-deux représente le khi-deux total pour l’ensemble du tableau de contingence (ici à 63,54), que nous aborderons dans la section suivante.

## 
##    Cell Contents
## |-------------------------|
## |                   Count |
## |         Expected Values |
## | Chi-square contribution |
## |             Row Percent |
## |          Column Percent |
## |           Total Percent |
## |                Residual |
## |-------------------------|
## 
## Total Observations in Table:  279 
## 
##                | TabKhi2$Periode 
## TabKhi2$Taille | Av. 1975  |  1975-79  |  1980-84  |  1985-89  |  1990-94  | Row Total | 
## ---------------|-----------|-----------|-----------|-----------|-----------|-----------|
##      < 25 log. |        6  |       11  |        8  |       14  |       41  |       80  | 
##                |    16.06  |    13.76  |    13.76  |    13.48  |    22.94  |           | 
##                |     6.30  |     0.55  |     2.41  |     0.02  |    14.22  |           | 
##                |     7.50% |    13.75% |    10.00% |    17.50% |    51.25% |    28.67% | 
##                |    10.71% |    22.92% |    16.67% |    29.79% |    51.25% |           | 
##                |     2.15% |     3.94% |     2.87% |     5.02% |    14.70% |           | 
##                |   -10.06  |    -2.76  |    -5.76  |     0.52  |    18.06  |           | 
## ---------------|-----------|-----------|-----------|-----------|-----------|-----------|
##          25-49 |       10  |        5  |        8  |        8  |       22  |       53  | 
##                |    10.64  |     9.12  |     9.12  |     8.93  |    15.20  |           | 
##                |     0.04  |     1.86  |     0.14  |     0.10  |     3.05  |           | 
##                |    18.87% |     9.43% |    15.09% |    15.09% |    41.51% |    19.00% | 
##                |    17.86% |    10.42% |    16.67% |    17.02% |    27.50% |           | 
##                |     3.58% |     1.79% |     2.87% |     2.87% |     7.89% |           | 
##                |    -0.64  |    -4.12  |    -1.12  |    -0.93  |     6.80  |           | 
## ---------------|-----------|-----------|-----------|-----------|-----------|-----------|
##          50-99 |       20  |       21  |       22  |       21  |       15  |       99  | 
##                |    19.87  |    17.03  |    17.03  |    16.68  |    28.39  |           | 
##                |     0.00  |     0.92  |     1.45  |     1.12  |     6.31  |           | 
##                |    20.20% |    21.21% |    22.22% |    21.21% |    15.15% |    35.48% | 
##                |    35.71% |    43.75% |    45.83% |    44.68% |    18.75% |           | 
##                |     7.17% |     7.53% |     7.89% |     7.53% |     5.38% |           | 
##                |     0.13  |     3.97  |     4.97  |     4.32  |   -13.39  |           | 
## ---------------|-----------|-----------|-----------|-----------|-----------|-----------|
##       100 et + |       20  |       11  |       10  |        4  |        2  |       47  | 
##                |     9.43  |     8.09  |     8.09  |     7.92  |    13.48  |           | 
##                |    11.83  |     1.05  |     0.45  |     1.94  |     9.77  |           | 
##                |    42.55% |    23.40% |    21.28% |     8.51% |     4.26% |    16.85% | 
##                |    35.71% |    22.92% |    20.83% |     8.51% |     2.50% |           | 
##                |     7.17% |     3.94% |     3.58% |     1.43% |     0.72% |           | 
##                |    10.57  |     2.91  |     1.91  |    -3.92  |   -11.48  |           | 
## ---------------|-----------|-----------|-----------|-----------|-----------|-----------|
##   Column Total |       56  |       48  |       48  |       47  |       80  |      279  | 
##                |    20.07% |    17.20% |    17.20% |    16.85% |    28.67% |           | 
## ---------------|-----------|-----------|-----------|-----------|-----------|-----------|
## 
##  
## Statistics for All Table Factors
## 
## 
## Pearson's Chi-squared test 
## ------------------------------------------------------------
## Chi^2 =  63.54291     d.f. =  12     p =  5.063109e-09 
## 
## 
##  
##        Minimum expected frequency: 7.917563

Références

Apparicio, Philippe. 2002. « Apport des systèmes d’information géographique à l’étude de l’insertion des HLM dans les quartiers montréalais ». Thèse de doctorat, Université du Maine. http://www.theses.fr/2002LEMA3007.