Chapitre 8 Régressions linéaires généralisées (GLM)
Dans ce chapitre, nous présentons les modèles linéaires généralisés plus communément appelés GLM (generalized linear models en anglais). Il s’agit d’une extension directe du modèle de régression linéaire multiple (LM) basé sur la méthode des moindres carrés ordinaires, décrite dans le chapitre précédent. Pour aborder cette section sereinement, il est important d’avoir bien compris le concept de distribution présenté dans la section 2.4. À la fin de cette section, vous serez en mesure de :
- comprendre la distinction entre un modèle LM classique et un GLM;
- identifier les composantes d’un GLM;
- interpréter les résultats d’un GLM;
- effectuer les diagnostics d’un GLM.
Dans ce chapitre, nous utilisons principalement les packages suivants :
- Pour créer des graphiques :
ggplot2
, le seul, l’unique!ggpubr
pour combiner des graphiques et réaliser des diagrammes.
- Pour ajuster des modèles GLM :
VGAM
etgamlss
offrent tous les deux un très large choix de distributions et de fonctions de diagnostic, mais nécessitent souvent un peu plus de code.mgcv
offre moins de distributions que les deux précédents, mais est plus simple d’utilisation.
- Pour analyser des modèles GLM :
car
essentiellement pour la fonctionvif
.DHARMa
pour le diagnostic des résidus simulés.ROCR
etcaret
pour l’analyse de la qualité d’ajustement de modèles pour des variables qualitatives.AER
pour des tests de surdispersion.fitdistrplus
pour ajuster des distributions à des données.LaplacesDemon
pour manipuler certaines distributions.sandwich
pour générer des erreurs standards robustes pour le modèle GLM logistique binomial.