Tests Statistiques et Hypothèses

Tests Statistiques et Hypothèses

Tests Statistiques et Hypothèses

Description du cours

Dans ce chapitre, nous présenterons quelques questions de recherche et les tests statistiques correspondants, ainsi que les hypothèses des tests.

Sommaire:

Livre Apparenté

Pratique des Statistiques dans R II - Comparaison de Groupes: Variables Numériques

Questions de recherche et statistiques

Les questions de recherche les plus populaires sont les suivantes:

  1. est-ce que deux variables (n = 2) sont corrélées (c.-à-d. associées)?
  2. est-ce que plusieurs variables (n > 2) sont corrélées?
  3. est-ce que deux groupes (n = 2) d’échantillons différent les uns des autres?
  4. est-ce que plusieurs groupes (n >= 2) d’échantillons différenciés les uns des autres?
  5. est-ce que la variabilité de deux échantillons ou plus diffère?

On peut répondre à chacune de ces questions à l’aide des tests statistiques suivants:

  1. Test de corrélation entre deux variables
  2. Matrice de corrélation entre plusieurs variables
  3. Comparaison des moyennes de deux groupes:
    • Test t de Student (paramétrique)
    • Test de Wilcoxon (non paramétrique)
  4. Comparaison des moyennes de plus de deux groupes
    • Test ANOVA (analyse de variance, paramétrique) : extension du test t pour comparer plus de deux groupes.
    • Test de Kruskal-Wallis (non paramétrique) : extension du test de Wilcoxon pour comparer plus de deux groupes
  5. Comparaison des variances:
    • Comparaison des variances de deux groupes : Test F (paramétrique)
    • Comparaison des variances de plus de deux groupes : Test de Bartlett (paramétrique), Test de Levene (paramétrique) et Test de Fligner-Killeen (non-paramétrique)

Hypothèses des tests statistiques

Bon nombre des méthodes statistiques, notamment la corrélation, la régression, le test t et l’analyse de la variance, supposent certaines caractéristiques des données. En général, ils supposent que:

  • les données suivent une distribution normale
  • et les variances des groupes à comparer sont homogènes (égales).

Ces hypothèses doivent être prises au sérieux pour tirer une interprétation et des conclusions fiables de la recherche.

Ces tests - corrélation, t-test et ANOVA - sont appelés tests paramétriques, car leur validité dépend de la distribution des données.

Avant d’utiliser les tests paramétriques, certains tests préliminaires doivent être effectués pour s’assurer que les hypothèses de test sont respectées. Dans les cas où les hypothèses ne sont pas respectées, il est recommandé d’utiliser des tests non paramétriques.

Évaluer la normalité

  1. Avec des échantillons suffisamment grands (n > 30), la violation de l’hypothèse de normalité ne devrait pas poser de problèmes majeurs (théorème central limite). Cela implique que nous pouvons ignorer la distribution des données et utiliser des tests paramétriques.
  2. Cependant, par souci de logique, nous pouvons utiliser le test statistique de Shapiro-Wilk comparant la distribution de l’échantillon à une distribution normale afin de déterminer si les données montrent ou non un écart important par rapport à la disribution normale (Ghasemi and Zahediasl 2012).

Évaluer l’égalité des variances

Le test t standard de Student (comparaison de deux échantillons indépendants) et le test ANOVA (comparaison de plusieurs échantillons) supposent également que les échantillons à comparer ont des variances égales.

Si les échantillons, à comparer, suivent une distribution normale, alors il est possible d’utiliser:

  • Test F pour comparer les variances de deux échantillons
  • Test de Bartlett ou Test de Levene pour comparer les variances de plusieurs échantillons.

Résumé

Ce chapitre présente les tests statistiques les plus couramment utilisés et leurs hypothèses.

References

Ghasemi, Asghar, and Saleh Zahediasl. 2012. “Normality Tests for Statistical Analysis: A Guide for Non-Statisticians.” Int J Endocrinol Metab 10 (2): 486–89. doi:10.5812/ijem.3505.



Version: English

Leçons

  1. Bon nombre des méthodes statistiques, dont les tests de corrélation, de régression, les tests t et l'analyse de la variance, supposent que les données suivent une distribution normale ou une distribution gaussienne. Dans ce chapitre, vous apprendrez comment vérifier la normalité des données dans R par inspection visuelle (graphiques QQ plot et distributions de densité) et par tests statistiques (test deShapiro-Wilk).
  2. Certains tests statistiques, comme le test T sur deux échantillons indépendants et le test ANOVA, supposent que les variances sont égales entre les groupes. Ce chapitre décrit les méthodes de vérification de l'homogénéité des variances dans R sur deux groupes ou plus. Ces tests comprennent : le test F, test de Bartlett, test de Levene et test de Fligner-Killeen.
  3. L'ANOVA sur mesures répétées suppose que les variances des différences, entre toutes les combinaisons de groupes, sont égales. C'est ce qu'on appelle l'hypothèse de sphéricité. Le test de sphéricité de Mauchly est utilisé pour évaluer si l'hypothèse de sphéricité est remplie ou non. Dans cet article, vous apprendrez à : 1) Calculer la sphéricité ; 2) Calculer le test de sphéricité de Mauchly dans R ; 3) Interpréter les résultats de l'ANOVA sur mesures répétées lorsque l'hypothèse de sphéricité est atteinte ou violée. 4) Extraire le tableau de l'ANOVA automatiquement corrigé pour la déviation à la sphéricité.

Comment ( 1 )

  • Don Folly

    Je désire obtenir les livres gratuits sur l’analyse de données

Give a comment

Want to post an issue with R? If yes, please make sure you have read this: How to Include Reproducible R Script Examples in Datanovia Comments

Teachers