Comparaison de Plusieurs Moyennes dans R

Comparaison de Plusieurs Moyennes dans R
Featured

Comparaison de Plusieurs Moyennes dans R

Description du cours

Cette partie décrit comment comparer plusieurs moyennes dans R à l’aide de la méthode ANOVA (Analysis of Variance) et des variantes, notamment:

  • Test ANOVA pour comparer des mesures indépendantes.
  • ANOVA sur mesures répétées, qui est utilisé pour l’analyse des données lorsque les mêmes sujets sont mesurés plus d’une fois.
  • ANOVA mixte, qui permet de comparer les moyennes des groupes croisées par au moins deux facteurs, l’un étant un facteur “intra-sujets” (mesures répétées) et l’autre étant un facteur “inter-sujets”.
  • ANCOVA (analyse de la covariance), une extension de l’ANOVA à un facteur qui incorpore une covariable.
  • MANOVA (multivariate analysis of variance ou analyse multivariée de la variance), une analyse de variance avec deux ou plusieurs variables-réponses continues.

Nous fournissons également un code R pour vérifier les hypothèses de l’ANOVA et effectuer des analyses post-hoc. De plus, nous vous présenterons:

  • Le test de Kruskal-Wallis, qui est une alternative non paramétrique au test ANOVA à un facteur.
  • Le test de Friedman, qui est une alternative non paramétrique au test ANOVA pour mesures répétées à un facteur.

Livre Apparenté

Pratique des Statistiques dans R II - Comparaison de Groupes: Variables Numériques

Fonctions et packages R

Il y a différentes fonctions/paquets dans R pour calculer ANOVA. Il s’agit notamment:

  • aov() [stats] : Calcul l’ANOVA de type I. Ne doit être utilisé que lorsque vous avez des plans équilibrés (les groupes sont de taille égale).
  • Anova() [car] : Calcul l’ANOVA de type II et de type III. Le type II donnera des résultats d’ANOVA identiques à ceux du type I lorsque les données sont équilibrées. Lorsque les données sont déséquilibrées, le type III imitera l’approche adoptée par les packages statistiques commerciaux populaires comme SAS et SPSS, mais cette approche n’est pas sans critique.
  • ezANOVA() [ez], car_aov() [afex] et anova_test() [rstatix] : Emballages autour de la fonction Anova() [car] pour faciliter les différents types d’analyse de variances, notamment l’ANOVA pour mesures répétées (design within-Ss ou intra-sujets), l’ANOVA pour mesures indépendantes (design between-Ss ou inter-sujet) et l’ANOVA pour mesures mixtes (design mixte within-and-between-Ss).

L’avantage de anova_test() [rstatix] est qu’il supporte à la fois les modèles et les formules comme entrées. Les variables peuvent aussi être spécifiées en tant que vecteur de caractère à l’aide des arguments dv, wid, between, within, covariate. Plus d’informations dans la documentation en tapant ?anova_test dans la console R. Il fournit un cadre simple et intuitif, compatible avec les pipes, cohérent avec la philosophie de conception tidyverse. En outre, il prend en charge les données groupées renvoyées par la fonction dplyr::group_by(). Les résultats comprennent le tableau ANOVA, la taille de l’effet généralisé et certaines vérifications d’hypothèses.

Dans ce guide, nous utiliserons principalement la fonction anova_test().

Recommandations

  • La variable-réponse, également appelée variable dépendante (dv), doit être numérique
  • Les variables de groupement, aussi appelées variables prédicteurs ou variables indépendantes, devraient être des facteurs. Si vous voulez calculer des modèles ANCOVA, vous pouvez également ajouter des prédicteurs numériques.
  • N’utilisez pas les fonctions R aov() et anova() pour obtenir les tables ANOVA sauf si vous savez ce que vous faites. Ils calculent le type-I sum of squares (somme des carrés des écarts de type I), ce qui ne convient pas, par exemple, pour les plans non équilibrés. Les résultats, obtenus avec les options par défaut de ces fonctions, sont différents de ceux obtenus avec les logiciels de statistiques commerciaux, notamment SPSS et SAS, et la plupart des autres logiciels de statistiques. Ces différences sont importantes et porteront à confusion et vous donneront des résultats trompeurs si vous ne les comprenez pas.

Suivez les recommandations ci-dessous:

  • Si vous avez un plan factoriel avec des mesures indépendantes, vous pouvez définir votre modèle à l’aide de lm() et ensuite utiliser rstatix::anova_test() ou car::Anova() pour calculer les tests F.
  • Si vous avez un parfait plan de mesures répétées équilibrées sans valeurs manquantes, alors utilisez rstatix::anova_test().
  • Si vous avez un plan déséquilibré pour mesures répétées, ou si vous avez des mesures répétées avec des données manquantes, utilisez plutôt des modèles mixtes linéaires via la commande lme4::lmer().



Version: English

Leçons

  1. Le test ANOVA (ou Analyse de variance) est utilisé pour comparer la moyenne de plusieurs groupes. Ce chapitre décrit les différents types d'ANOVA pour comparer les groupes indépendants, notamment : 1) ANOVA à un facteur : une extension du test sur échantillons indépendants pour comparer les moyennes dans une situation où il y a plus de deux groupes. 2) ANOVA à deux facteurs utilisée pour évaluer simultanément l'effet de deux variables de groupement différentes sur une variable-réponse continue. 3) ANOVA à trois facteur utilisée pour évaluer simultanément l'effet de trois variables de groupement différentes sur une variable-réponse continue.
  2. L'ANOVA sur mesures répétées est utilisée pour analyser des données lorsque les mêmes sujets sont mesurés plus d'une fois. Ce chapitre décrit les différents types d'ANOVA sur mesures répétées ANOVA, notamment : 1) ANOVA à un facteur sur mesures répétées, une extension du test t sur échantillons appariés pour comparer les moyennes de trois niveaux ou plus d'une variable intra-sujets. 2) ANOVA à deux facteurs sur mesures répétées, utilisée pour évaluer simultanément l'effet de deux facteurs intra-sujets sur une variable-réponse continue. 3) ANOVA à trois facteurs sur mesures répétées, utilisée pour évaluer simultanément l'effet de trois facteurs intra-sujets sur une variable-réponse continue.
  3. L'ANOVA mixte sert à comparer les moyennes des groupes classés selon deux différents types de variables catégorielles, notamment : i) les facteurs inter-sujets, qui ont des catégories indépendantes (par exemple, sexe : hommes/femmes) ; ii) les facteurs intra-sujets, qui ont des catégories apparentées, également désignées sous l'expression de mesures répétées (par exemple, le temps: avant/après traitement). Ce chapitre décrit comment calculer et interpréter les différents tests ANOVA mixtes dans R.
  4. L'Analyse de la covariance (ANCOVA) sert à comparer les moyennes d'une variable-réponse entre deux ou plusieurs groupes en tenant compte (ou en corrigeant) la variabilité d'autres variables, appelées covariables. Dans ce chapitre, vous apprendrez comment calculer et interpréter l'ANCOVA à un facteur et à deux facteurs dans R.
  5. L'analyse multivariée de la variance (MANOVA) est une ANOVA avec au moins deux variables-réponse continues. Le test MANOVA à un facteur teste simultanément les différences statistiques pour plusieurs variables-réponse en fonction d'une seule variable de groupement. Ce chapitre décrit comment calculer le test MANOVA à un facteur dans R.
  6. Le test de Kruskal-Wallis est une alternative non paramétrique au test ANOVA à un facteur. Il est recommandé lorsque les hypothèses du test ANOVA à un facteur ne sont pas respectées. Ce chapitre décrit comment calculer le test de Kruskal-Wallis à l'aide du logiciel R.
  7. Le test de Friedman est une alternative non paramétrique au test ANOVA à un facteur sur mesures répétées. Il étend le test des signes dans le cas où il y a plus de deux groupes à comparer. Il est recommandé lorsque les hypothèses de normalité du test ANOVA à un facteur sur mesures répétées ne sont pas respectées ou lorsque la variable dépendante est mesurée sur une échelle ordinale. Dans ce chapitre, vous apprendrez à calculer le test de Friedman dans R et à effectuer des comparaisons par paires entre groupes.

Comment ( 1 )

  • Aboubacar BOLY

    j’aimerai apprendre les analyse sur R pour effectuer les analyses dans le cadre de mes études de thèse.

Give a comment

Want to post an issue with R? If yes, please make sure you have read this: How to Include Reproducible R Script Examples in Datanovia Comments

Teachers