Chapitre 8 Régressions linéaires généralisées (GLM)

Dans ce chapitre, nous présentons les modèles linéaires généralisés plus communément appelés GLM (generalized linear models en anglais). Il s’agit d’une extension directe du modèle de régression linéaire multiple (LM) basé sur la méthode des moindres carrés ordinaires, décrite dans le chapitre précédent. Pour aborder cette section sereinement, il est important d’avoir bien compris le concept de distribution présenté dans la section 2.4. À la fin de cette section, vous serez en mesure de :

comprendre la distinction entre un modèle LM classique et un GLM;
identifier les composantes d’un GLM;
interpréter les résultats d’un GLM;
effectuer les diagnostics d’un GLM.

Dans ce chapitre, nous utilisons principalement les packages suivants :

Pour créer des graphiques :
- ggplot2, le seul, l’unique!
- ggpubr pour combiner des graphiques et réaliser des diagrammes.
Pour ajuster des modèles GLM :
- VGAM et gamlss offrent tous les deux un très large choix de distributions et de fonctions de diagnostic, mais nécessitent souvent un peu plus de code.
- mgcv offre moins de distributions que les deux précédents, mais est plus simple d’utilisation.
Pour analyser des modèles GLM :
car essentiellement pour la fonction vif.
DHARMa pour le diagnostic des résidus simulés.
ROCR et caret pour l’analyse de la qualité d’ajustement de modèles pour des variables qualitatives.
AER pour des tests de surdispersion.
fitdistrplus pour ajuster des distributions à des données.
LaplacesDemon pour manipuler certaines distributions.
sandwich pour générer des erreurs standards robustes pour le modèle GLM logistique binomial.