{"id":11054,"date":"2019-12-08T00:20:15","date_gmt":"2019-12-07T22:20:15","guid":{"rendered":"https:\/\/www.datanovia.com\/en\/?post_type=dt_lessons&#038;p=11054"},"modified":"2019-12-08T00:20:15","modified_gmt":"2019-12-07T22:20:15","slug":"test-t-dans-r","status":"publish","type":"dt_lessons","link":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/","title":{"rendered":"Test T dans R"},"content":{"rendered":"<div id=\"rdoc\">\n<p>Le <strong>test t<\/strong> est utilis\u00e9 pour comparer deux moyennes.<\/p>\n<p>Ce chapitre d\u00e9crit les diff\u00e9rents types de tests t, notamment:<\/p>\n<ul>\n<li><em>tests t pour \u00e9chantillon unique<\/em>,<\/li>\n<li><em>t-test pour \u00e9chantillons ind\u00e9pendants : Test t de Student et test t de Welch<\/em><\/li>\n<li><em>T test pour \u00e9chantillons appari\u00e9s<\/em>.<\/li>\n<\/ul>\n<p>Vous apprendrez \u00e0:<\/p>\n<ul>\n<li><strong>Calculez les diff\u00e9rents t-tests dans R<\/strong>. La fonction <code>t_test()<\/code> [paquet rstatix], qui est compatible avec les pipes, sera utilis\u00e9e.<\/li>\n<li><strong>V\u00e9rifier les hypoth\u00e8ses du test t<\/strong><\/li>\n<li><strong>Calculez et rapportez la taille de l\u2019effet du test t<\/strong> en utilisant le <em>d de Cohen<\/em>. La statistique \u201cd\u201d red\u00e9finit la diff\u00e9rence de moyennes comme le nombre d\u2019\u00e9carts-types qui s\u00e9pare ces moyennes. Les tailles d\u2019effet conventionnelles des tests T, propos\u00e9es par Cohen, sont : 0,2 (petit effet), 0,5 (effet mod\u00e9r\u00e9) et 0,8 (effet important) <span class=\"citation\">(Cohen 1998)<\/span>.<\/li>\n<\/ul>\n<p>Sommaire:<\/p>\n<div id=\"TOC\">\n<ul>\n<li><a href=\"#prerequis\">Pr\u00e9requis<\/a><\/li>\n<li><a href=\"#tests-t-pour-echantillon-unique\">Tests t pour \u00e9chantillon unique<\/a>\n<ul>\n<li><a href=\"#donnees-de-demonstration\">Donn\u00e9es de d\u00e9monstration<\/a><\/li>\n<li><a href=\"#statistiques-descriptives\">Statistiques descriptives<\/a><\/li>\n<li><a href=\"#visualisation\">Visualisation<\/a><\/li>\n<li><a href=\"#hypotheses-et-tests-preliminaires\">Hypoth\u00e8ses et tests pr\u00e9liminaires<\/a><\/li>\n<li><a href=\"#calculs\">Calculs<\/a><\/li>\n<li><a href=\"#taille-de-leffet\">Taille de l\u2019effet<\/a><\/li>\n<li><a href=\"#rapporter\">Rapporter<\/a><\/li>\n<\/ul>\n<\/li>\n<li><a href=\"#t-test-pour-echantillons-independants\">T-test pour \u00e9chantillons ind\u00e9pendants<\/a>\n<ul>\n<li><a href=\"#donnees-de-demonstration-1\">Donn\u00e9es de d\u00e9monstration<\/a><\/li>\n<li><a href=\"#statistiques-descriptives-1\">Statistiques descriptives<\/a><\/li>\n<li><a href=\"#visualisation-1\">Visualisation<\/a><\/li>\n<li><a href=\"#hypotheses-et-tests-preliminaires-1\">Hypoth\u00e8ses et tests pr\u00e9liminaires<\/a><\/li>\n<li><a href=\"#calculs-1\">Calculs<\/a><\/li>\n<li><a href=\"#taille-de-leffet-1\">Taille de l\u2019effet<\/a><\/li>\n<li><a href=\"#rapporter-1\">Rapporter<\/a><\/li>\n<\/ul>\n<\/li>\n<li><a href=\"#pstt\">T-test pour \u00e9chantillons appari\u00e9s<\/a>\n<ul>\n<li><a href=\"#donnees-de-demonstration-2\">Donn\u00e9es de d\u00e9monstration<\/a><\/li>\n<li><a href=\"#statistiques-descriptives-2\">Statistiques descriptives<\/a><\/li>\n<li><a href=\"#visualisation-2\">Visualisation<\/a><\/li>\n<li><a href=\"#hypotheses-et-tests-preliminaires-2\">Hypoth\u00e8ses et tests pr\u00e9liminaires<\/a><\/li>\n<li><a href=\"#calculs-2\">Calculs<\/a><\/li>\n<li><a href=\"#taille-de-leffet-2\">Taille de l\u2019effet<\/a><\/li>\n<li><a href=\"#rapporter-2\">Rapporter<\/a><\/li>\n<\/ul>\n<\/li>\n<li><a href=\"#resume\">R\u00e9sum\u00e9<\/a><\/li>\n<li><a href=\"#references\">References<\/a><\/li>\n<\/ul>\n<\/div>\n<div class='dt-sc-hr-invisible-medium  '><\/div>\n<div class='dt-sc-ico-content type1'><div class='custom-icon' ><a href='https:\/\/www.datanovia.com\/en\/fr\/produit\/pratiques-des-statistiques-dans-r-pour-comparaison-de-groupes-variables-numeriques\/' target='_blank'><span class='fa fa-book'><\/span><\/a><\/div><h4><a href='https:\/\/www.datanovia.com\/en\/fr\/produit\/pratiques-des-statistiques-dans-r-pour-comparaison-de-groupes-variables-numeriques\/' target='_blank'> Livre Apparent\u00e9 <\/a><\/h4>Pratique des Statistiques dans R II - Comparaison de Groupes: Variables Num\u00e9riques<\/div>\n<div class='dt-sc-hr-invisible-medium  '><\/div>\n<div id=\"prerequis\" class=\"section level2\">\n<h2>Pr\u00e9requis<\/h2>\n<p>Assurez-vous d\u2019avoir install\u00e9 les paquets R suivants:<\/p>\n<ul>\n<li><code>tidyverse<\/code> pour la manipulation et la visualisation des donn\u00e9es<\/li>\n<li><code>ggpubr<\/code> pour cr\u00e9er facilement des graphiques pr\u00eats \u00e0 la publication<\/li>\n<li><code>rstatix<\/code> offre des fonctions R conviviales pour des analyses statistiques faciles \u00e0 r\u00e9aliser.<\/li>\n<li><code>datarium<\/code>: contient les jeux de donn\u00e9es requis pour ce chapitre.<\/li>\n<\/ul>\n<p>Commencez par charger les packages requis suivants:<\/p>\n<pre class=\"r\"><code>library(tidyverse)\r\nlibrary(ggpubr)\r\nlibrary(rstatix)<\/code><\/pre>\n<\/div>\n<div id=\"tests-t-pour-echantillon-unique\" class=\"section level2\">\n<h2>Tests t pour \u00e9chantillon unique<\/h2>\n<p>Le <strong>test t pour \u00e9chantillon unique<\/strong>, \u00e9galement connu sous le nom de <em>test t pour une seule moyenne<\/em> , est utilis\u00e9 pour comparer la moyenne d\u2019un \u00e9chantillon \u00e0 une moyenne standard connue (ou th\u00e9orique \/ hypoth\u00e9tique).<\/p>\n<p>G\u00e9n\u00e9ralement, la moyenne th\u00e9orique provient de:<\/p>\n<ul>\n<li>une exp\u00e9rience pr\u00e9c\u00e9dente. Par exemple, en comparant si le poids moyen des souris diff\u00e8re de 200 mg, une valeur d\u00e9termin\u00e9e dans une \u00e9tude pr\u00e9c\u00e9dente.<\/li>\n<li>ou d\u2019une exp\u00e9rience o\u00f9 vous avez des conditions contr\u00f4les et de traitements. Si vous exprimez vos donn\u00e9es en \u201cpourcentage de contr\u00f4le\u201d, vous pouvez tester si la valeur moyenne de la condition de traitement diff\u00e8re significativement de 100.<\/li>\n<\/ul>\n<div id=\"donnees-de-demonstration\" class=\"section level3\">\n<h3>Donn\u00e9es de d\u00e9monstration<\/h3>\n<p>Jeu de donn\u00e9es de d\u00e9monstration : <code>mice<\/code> [package datarium]. Contient le poids de 10 souris:<\/p>\n<pre class=\"r\"><code># Charger et inspecter les donn\u00e9es\r\ndata(mice, package = \"datarium\")\r\nhead(mice, 3)<\/code><\/pre>\n<pre><code>## # A tibble: 3 x 2\r\n##   name  weight\r\n##   &lt;chr&gt;  &lt;dbl&gt;\r\n## 1 M_1     18.9\r\n## 2 M_2     19.5\r\n## 3 M_3     23.1<\/code><\/pre>\n<\/div>\n<div id=\"statistiques-descriptives\" class=\"section level3\">\n<h3>Statistiques descriptives<\/h3>\n<p>Calculer quelques statistiques sommaires : nombre de sujets, moyenne et sd (\u00e9cart-type)<\/p>\n<pre class=\"r\"><code>mice %&gt;% get_summary_stats(weight, type = \"mean_sd\")<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 4\r\n##   variable     n  mean    sd\r\n##   &lt;chr&gt;    &lt;dbl&gt; &lt;dbl&gt; &lt;dbl&gt;\r\n## 1 weight      10  20.1  1.90<\/code><\/pre>\n<\/div>\n<div id=\"visualisation\" class=\"section level3\">\n<h3>Visualisation<\/h3>\n<p>Cr\u00e9er un boxplot pour visualiser la distribution du poids des souris. Ajoutez \u00e9galement des points jitter pour montrer les observations individuelles. Le gros point repr\u00e9sente le point moyen.<\/p>\n<pre class=\"r\"><code>bxp &lt;- ggboxplot(\r\n  mice$weight, width = 0.5, add = c(\"mean\", \"jitter\"), \r\n  ylab = \"Weight (g)\", xlab = FALSE\r\n  )\r\nbxp<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-one-sample-box-plot-1.png\" width=\"364.8\" \/><\/p>\n<\/div>\n<div id=\"hypotheses-et-tests-preliminaires\" class=\"section level3\">\n<h3>Hypoth\u00e8ses et tests pr\u00e9liminaires<\/h3>\n<p>Le test t pour \u00e9chantillon unique suppose les caract\u00e9ristiques suivantes au sujet des donn\u00e9es:<\/p>\n<ul>\n<li><strong>Aucune valeur aberrante significative<\/strong> dans les donn\u00e9es<\/li>\n<li><strong>Normalit\u00e9<\/strong>. les donn\u00e9es devraient \u00eatre distribu\u00e9es approximativement normalement<\/li>\n<\/ul>\n<p>Dans cette section, nous effectuerons quelques tests pr\u00e9liminaires pour v\u00e9rifier si ces hypoth\u00e8ses sont respect\u00e9es.<\/p>\n<div id=\"identifier-les-valeurs-aberrantes\" class=\"section level4\">\n<h4>Identifier les valeurs aberrantes<\/h4>\n<p>Les valeurs aberrantes peuvent \u00eatre facilement identifi\u00e9es \u00e0 l\u2019aide des m\u00e9thodes boxplot, impl\u00e9ment\u00e9es dans la fonction R <code>identify_outliers()<\/code>[paquet rstatix].<\/p>\n<pre class=\"r\"><code>mice %&gt;% identify_outliers(weight)<\/code><\/pre>\n<pre><code>## [1] name       weight     is.outlier is.extreme\r\n## &lt;0 rows&gt; (or 0-length row.names)<\/code><\/pre>\n<div class=\"success\">\n<p>Il n\u2019y avait pas de valeurs extr\u00eames aberrantes.<\/p>\n<\/div>\n<div class=\"warning\">\n<p>Notez que, dans le cas o\u00f9 vous avez des valeurs extr\u00eames aberrantes, cela peut \u00eatre d\u00fb \u00e0 : 1) erreurs de saisie de donn\u00e9es, erreurs de mesure ou valeurs inhabituelles.<\/p>\n<p>Dans ce cas, vous pourriez envisager d\u2019ex\u00e9cuter le test de Wilcoxon non param\u00e9trique.<\/p>\n<\/div>\n<\/div>\n<div id=\"verifier-lhypothese-de-normalite\" class=\"section level4\">\n<h4>V\u00e9rifier l\u2019hypoth\u00e8se de normalit\u00e9<\/h4>\n<p>L\u2019hypoth\u00e8se de normalit\u00e9 peut \u00eatre v\u00e9rifi\u00e9e en calculant le test Shapiro-Wilk. Si les donn\u00e9es sont normalement distribu\u00e9es, la p-value doit \u00eatre sup\u00e9rieure \u00e0 0,05.<\/p>\n<pre class=\"r\"><code>mice %&gt;% shapiro_test(weight)<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 3\r\n##   variable statistic     p\r\n##   &lt;chr&gt;        &lt;dbl&gt; &lt;dbl&gt;\r\n## 1 weight       0.923 0.382<\/code><\/pre>\n<div class=\"success\">\n<p>Selon le r\u00e9sultat, la p-value est sup\u00e9rieure au niveau de significativit\u00e9 0,05 indiquant que la distribution des donn\u00e9es n\u2019est pas significativement diff\u00e9rente de la distribution normale. En d\u2019autres termes, nous pouvons supposer que la normalit\u00e9.<\/p>\n<\/div>\n<p>Vous pouvez \u00e9galement cr\u00e9er un QQ plot des donn\u00e9es de <code>weight<\/code>. Le graphique QQ plot dessine la corr\u00e9lation entre une donn\u00e9e d\u00e9finie et la distribution normale.<\/p>\n<pre class=\"r\"><code>ggqqplot(mice, x = \"weight\")<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-qqplot-1.png\" width=\"288\" \/><\/p>\n<div class=\"success\">\n<p>Tous les points se situent approximativement le long de la ligne de r\u00e9f\u00e9rence (45 degr\u00e9s), pour chaque groupe. Nous pouvons donc supposer la normalit\u00e9 des donn\u00e9es.<\/p>\n<\/div>\n<div class=\"warning\">\n<p>Notez que, si la taille de votre \u00e9chantillon est sup\u00e9rieure \u00e0 50, le graphique de normalit\u00e9 QQ plot est pr\u00e9f\u00e9r\u00e9 parce qu\u2019avec des \u00e9chantillons de plus grande taille, le test de Shapiro-Wilk devient tr\u00e8s sensible m\u00eame \u00e0 un \u00e9cart mineur par rapport \u00e0 la normale.<\/p>\n<p>Si les donn\u00e9es ne sont pas normalement distribu\u00e9es, il est recommand\u00e9 d\u2019utiliser un test non param\u00e9trique tel que le <em>test de Wilcoxon \u00e0 \u00e9chantillon unique<\/em>. Ce test est semblable au test t pour \u00e9chantillon unique, mais il est ax\u00e9 sur la m\u00e9diane plut\u00f4t que sur la moyenne.<\/p>\n<\/div>\n<\/div>\n<\/div>\n<div id=\"calculs\" class=\"section level3\">\n<h3>Calculs<\/h3>\n<p>Nous voulons savoir si le poids moyen des souris diff\u00e8re du 25g (test bilat\u00e9ral) ?<\/p>\n<pre class=\"r\"><code>stat.test &lt;- mice %&gt;% t_test(weight ~ 1, mu = 25)\r\nstat.test<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 7\r\n##   .y.    group1 group2         n statistic    df       p\r\n## * &lt;chr&gt;  &lt;chr&gt;  &lt;chr&gt;      &lt;int&gt;     &lt;dbl&gt; &lt;dbl&gt;   &lt;dbl&gt;\r\n## 1 weight 1      null model    10     -8.10     9 0.00002<\/code><\/pre>\n<p>Les r\u00e9sultats ci-dessus montrent les composantes suivantes:<\/p>\n<ul>\n<li><code>.y.<\/code>: la variable-r\u00e9ponse utilis\u00e9e dans le test.<\/li>\n<li><code>group1,group2<\/code>: en g\u00e9n\u00e9ral, les groupes compar\u00e9s dans les tests par paires. Ici, nous avons le mod\u00e8le nul (test pour \u00e9chantillon unique).<\/li>\n<li><code>statistic<\/code>: statistique du test (valeur t) utilis\u00e9e pour calculer la p-value.<\/li>\n<li><code>df<\/code>: degr\u00e9s de libert\u00e9.<\/li>\n<li><code>p<\/code>: p-value.<\/li>\n<\/ul>\n<div class=\"warning\">\n<p>Vous pouvez obtenir un r\u00e9sultat d\u00e9taill\u00e9 en sp\u00e9cifiant l\u2019option <code>detailed = TRUE<\/code> dans la fonction <code>t_test()<\/code>.<\/p>\n<\/div>\n<\/div>\n<div id=\"taille-de-leffet\" class=\"section level3\">\n<h3>Taille de l\u2019effet<\/h3>\n<p>Pour calculer la taille de l\u2019effet, appel\u00e9e <code>d de Cohen<\/code>, du test t pour \u00e9chantillon unique, vous devez diviser la diff\u00e9rence moyenne par l\u2019\u00e9cart type de la diff\u00e9rence, comme indiqu\u00e9 ci-dessous. Notez que, ici: <code>sd(x-mu) = sd(x)<\/code>.<\/p>\n<p>La formule du d de Cohen:<\/p>\n<p><code>d = abs(mean(x) - mu)\/sd(x)<\/code>, o\u00f9:<\/p>\n<ul>\n<li><code>x<\/code> est un vecteur num\u00e9rique contenant les donn\u00e9es.<\/li>\n<li><code>mu<\/code> est la moyenne contre laquelle la moyenne de x est compar\u00e9e (la valeur par d\u00e9faut est mu = 0).<\/li>\n<\/ul>\n<p>Calculs:<\/p>\n<pre class=\"r\"><code>mice %&gt;% cohens_d(weight ~ 1, mu = 25)<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 6\r\n##   .y.    group1 group2     effsize     n magnitude\r\n## * &lt;chr&gt;  &lt;chr&gt;  &lt;chr&gt;        &lt;dbl&gt; &lt;int&gt; &lt;ord&gt;    \r\n## 1 weight 1      null model    10.6    10 large<\/code><\/pre>\n<div class=\"success\">\n<p>Rappelons que les taille de l\u2019effet conventionnelles du test t, propos\u00e9 par Cohen J. (1998), sont : 0,2 (petit effet), 0,5 (effet mod\u00e9r\u00e9) et 0,8 (effet important) (Cohen 1998). Comme la taille de l\u2019effet, d, est de 2,56, vous pouvez conclure qu\u2019il y a un effet important.<\/p>\n<\/div>\n<\/div>\n<div id=\"rapporter\" class=\"section level3\">\n<h3>Rapporter<\/h3>\n<p>Nous pourrions rapporter le r\u00e9sultat comme suit:<\/p>\n<p>Un test t pour \u00e9chantillon unique a \u00e9t\u00e9 calcul\u00e9 pour d\u00e9terminer si le poids moyen des souris incluses \u00e9tait diff\u00e9rent du poids moyen normal de la population (25 g).<\/p>\n<p>La valeur du poids des souris \u00e9tait normalement distribu\u00e9e, telle qu\u2019\u00e9valu\u00e9e par le test de Shapiro-Wilk (p &gt; 0,05) et il n\u2019y avait pas de valeurs extr\u00eames aberrantes dans les donn\u00e9es, telles qu\u2019\u00e9valu\u00e9es par la m\u00e9thode boxplot.<\/p>\n<p>Le poids moyen mesur\u00e9 des souris (20,14 +\/- 1,94) \u00e9tait statistiquement significativement inf\u00e9rieur au poids moyen normal de la population 25 (<code>t(9) = -8,1, p &lt; 0,0001, d = 2,56<\/code>) ; o\u00f9 t(9) est une notation courte pour une statistique t qui a 9 degr\u00e9s de libert\u00e9.<\/p>\n<p>Cr\u00e9er un box plot avec p-value:<\/p>\n<pre class=\"r\"><code>bxp + labs(\r\n  subtitle = get_test_label(stat.test, detailed = TRUE)\r\n  )<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-one-sample-box-plot-with-p-value-1.png\" width=\"336\" \/><\/p>\n<p>Cr\u00e9er un graphe de densit\u00e9 avec p-value:<\/p>\n<ul>\n<li>La ligne rouge correspond \u00e0 la moyenne observ\u00e9e<\/li>\n<li>La ligne bleue correspond \u00e0 la moyenne th\u00e9orique<\/li>\n<\/ul>\n<pre class=\"r\"><code>ggdensity(mice, x = \"weight\", rug = TRUE, fill = \"lightgray\") +\r\n  scale_x_continuous(limits = c(15, 27)) +\r\n  stat_central_tendency(type = \"mean\", color = \"red\", linetype = \"dashed\") +\r\n  geom_vline(xintercept = 25, color = \"blue\", linetype = \"dashed\") + \r\n  labs(subtitle = get_test_label(stat.test,  detailed = TRUE))<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-one-sample-density-with-p-value-1.png\" width=\"384\" \/><\/p>\n<\/div>\n<\/div>\n<div id=\"t-test-pour-echantillons-independants\" class=\"section level2\">\n<h2>T-test pour \u00e9chantillons ind\u00e9pendants<\/h2>\n<p>Le <strong>test t pour \u00e9chantillons ind\u00e9pendants<\/strong> (ou le test t pour \u00e9chantillons non appari\u00e9s) est utilis\u00e9 pour comparer la moyenne de deux groupes ind\u00e9pendants.<\/p>\n<p>Par exemple, vous pourriez vouloir comparer les poids moyens des individus regroup\u00e9s par sexe : les groupes d\u2019hommes et de femmes, qui sont deux groupes non apparent\u00e9s ou ind\u00e9pendants.<\/p>\n<p>Le t-test pour \u00e9chantillons ind\u00e9pendants se pr\u00e9sente sous deux formes diff\u00e9rentes:<\/p>\n<ul>\n<li>le <em>test t standard de Student<\/em>, qui suppose que la variance des deux groupes est \u00e9gale.<\/li>\n<li>le <em>test t de Welch<\/em>, qui est moins restrictif que le test original de Student. Il s\u2019agit du test o\u00f9 vous ne pr\u00e9sumez pas que la variance est la m\u00eame dans les deux groupes, ce qui donne les degr\u00e9s de libert\u00e9 fractionnaires suivants.<\/li>\n<\/ul>\n<div class=\"warning\">\n<p>Par d\u00e9faut, R calcule le test t de Weltch, qui est le plus prudent. Les deux m\u00e9thodes donnent des r\u00e9sultats tr\u00e8s semblables, \u00e0 moins que la taille des groupes et les \u00e9carts-types ne soient tr\u00e8s diff\u00e9rents.<\/p>\n<\/div>\n<div id=\"donnees-de-demonstration-1\" class=\"section level3\">\n<h3>Donn\u00e9es de d\u00e9monstration<\/h3>\n<p>Jeu de donn\u00e9es de d\u00e9monstration : <code>genderweight<\/code> [package datarium] contenant le poids de 40 individus (20 femmes et 20 hommes).<\/p>\n<p>Charger les donn\u00e9es et afficher quelques lignes al\u00e9atoires par groupes:<\/p>\n<pre class=\"r\"><code># Charger les donn\u00e9es\r\ndata(\"genderweight\", package = \"datarium\")\r\n# Afficher un \u00e9chantillon des donn\u00e9es par groupe\r\nset.seed(123)\r\ngenderweight %&gt;% sample_n_by(group, size = 2)<\/code><\/pre>\n<pre><code>## # A tibble: 4 x 3\r\n##   id    group weight\r\n##   &lt;fct&gt; &lt;fct&gt;  &lt;dbl&gt;\r\n## 1 6     F       65.0\r\n## 2 15    F       65.9\r\n## 3 29    M       88.9\r\n## 4 37    M       77.0<\/code><\/pre>\n<\/div>\n<div id=\"statistiques-descriptives-1\" class=\"section level3\">\n<h3>Statistiques descriptives<\/h3>\n<p>Calculer quelques statistiques descriptives par groupe : moyenne et sd (\u00e9cart-type)<\/p>\n<pre class=\"r\"><code>genderweight %&gt;%\r\n  group_by(group) %&gt;%\r\n  get_summary_stats(weight, type = \"mean_sd\")<\/code><\/pre>\n<pre><code>## # A tibble: 2 x 5\r\n##   group variable     n  mean    sd\r\n##   &lt;fct&gt; &lt;chr&gt;    &lt;dbl&gt; &lt;dbl&gt; &lt;dbl&gt;\r\n## 1 F     weight      20  63.5  2.03\r\n## 2 M     weight      20  85.8  4.35<\/code><\/pre>\n<\/div>\n<div id=\"visualisation-1\" class=\"section level3\">\n<h3>Visualisation<\/h3>\n<p>Visualiser les donn\u00e9es \u00e0 l\u2019aide de box plots. Graphique du poids par groupes.<\/p>\n<pre class=\"r\"><code>bxp &lt;- ggboxplot(\r\n  genderweight, x = \"group\", y = \"weight\", \r\n  ylab = \"Weight\", xlab = \"Groups\", add = \"jitter\"\r\n  )\r\nbxp<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-box-plot-two-samples-1.png\" width=\"364.8\" \/><\/p>\n<\/div>\n<div id=\"hypotheses-et-tests-preliminaires-1\" class=\"section level3\">\n<h3>Hypoth\u00e8ses et tests pr\u00e9liminaires<\/h3>\n<p>Le test t pour \u00e9chantillons ind\u00e9pendant assume les caract\u00e9ristiques suivantes au sujet des donn\u00e9es:<\/p>\n<ul>\n<li><strong>Ind\u00e9pendance des observations<\/strong>. Chaque sujet ne doit appartenir qu\u2019\u00e0 un seul groupe. Il n\u2019y a aucun lien entre les observations de chaque groupe.<\/li>\n<li><strong>Aucune valeur aberrante significative<\/strong> dans les deux groupes<\/li>\n<li><strong>Normalit\u00e9<\/strong>. les donn\u00e9es pour chaque groupe devraient \u00eatre distribu\u00e9es approximativement normalement.<\/li>\n<li><strong>Homog\u00e9n\u00e9it\u00e9 des variances<\/strong>. la variance de la variable-r\u00e9ponse devrait \u00eatre \u00e9gale dans chaque groupe.<\/li>\n<\/ul>\n<p>Dans cette section, nous effectuerons quelques tests pr\u00e9liminaires pour v\u00e9rifier si ces hypoth\u00e8ses sont respect\u00e9es.<\/p>\n<div id=\"identifier-les-valeurs-aberrantes-par-groupe\" class=\"section level4\">\n<h4>Identifier les valeurs aberrantes par groupe<\/h4>\n<pre class=\"r\"><code>genderweight %&gt;%\r\n  group_by(group) %&gt;%\r\n  identify_outliers(weight)<\/code><\/pre>\n<pre><code>## # A tibble: 2 x 5\r\n##   group id    weight is.outlier is.extreme\r\n##   &lt;fct&gt; &lt;fct&gt;  &lt;dbl&gt; &lt;lgl&gt;      &lt;lgl&gt;     \r\n## 1 F     20      68.8 TRUE       FALSE     \r\n## 2 M     31      95.1 TRUE       FALSE<\/code><\/pre>\n<div class=\"success\">\n<p>Il n\u2019y avait pas de valeurs extr\u00eames aberrantes.<\/p>\n<\/div>\n<\/div>\n<div id=\"verifier-la-normalite-par-groupes\" class=\"section level4\">\n<h4>V\u00e9rifier la normalit\u00e9 par groupes<\/h4>\n<pre class=\"r\"><code># Calculer le test d de Shapiro-Wilk par groupes\r\ndata(genderweight, package = \"datarium\")\r\ngenderweight %&gt;%\r\n  group_by(group) %&gt;%\r\n  shapiro_test(weight)<\/code><\/pre>\n<pre><code>## # A tibble: 2 x 4\r\n##   group variable statistic     p\r\n##   &lt;fct&gt; &lt;chr&gt;        &lt;dbl&gt; &lt;dbl&gt;\r\n## 1 F     weight       0.938 0.224\r\n## 2 M     weight       0.986 0.989<\/code><\/pre>\n<pre class=\"r\"><code># Dessiner un qq plot par groupe\r\nggqqplot(genderweight, x = \"weight\", facet.by = \"group\")<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-independent-samples-normality-assumption-1.png\" width=\"480\" \/><\/p>\n<div class=\"success\">\n<p>D\u2019apr\u00e8s les r\u00e9sultats ci-dessus, nous pouvons conclure que les donn\u00e9es des deux groupes sont normalement distribu\u00e9es.<\/p>\n<\/div>\n<\/div>\n<div id=\"verifier-legalite-des-variances\" class=\"section level4\">\n<h4>V\u00e9rifier l\u2019\u00e9galit\u00e9 des variances<\/h4>\n<p>Ceci peut \u00eatre fait \u00e0 l\u2019aide du test de Levene. Si les variances des groupes sont \u00e9gales, la p-value doit \u00eatre sup\u00e9rieure \u00e0 0,05.<\/p>\n<pre class=\"r\"><code>genderweight %&gt;% levene_test(weight ~ group)<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 4\r\n##     df1   df2 statistic      p\r\n##   &lt;int&gt; &lt;int&gt;     &lt;dbl&gt;  &lt;dbl&gt;\r\n## 1     1    38      6.12 0.0180<\/code><\/pre>\n<div class=\"success\">\n<p>La p-value du test de Levene est significative, ce qui sugg\u00e8re qu\u2019il existe une diff\u00e9rence significative entre les variances des deux groupes. Par cons\u00e9quent, nous utiliserons le test t de Weltch, qui ne suppose pas l\u2019\u00e9galit\u00e9 des deux variances.<\/p>\n<\/div>\n<\/div>\n<\/div>\n<div id=\"calculs-1\" class=\"section level3\">\n<h3>Calculs<\/h3>\n<p>Nous voulons savoir si les poids moyens sont diff\u00e9rents d\u2019un groupe \u00e0 l\u2019autre.<\/p>\n<p>Rappelons que, par d\u00e9faut, R calcule le test t de Weltch, qui est le plus prudent:<\/p>\n<pre class=\"r\"><code>stat.test &lt;- genderweight %&gt;% \r\n  t_test(weight ~ group) %&gt;%\r\n  add_significance()\r\nstat.test<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 9\r\n##   .y.    group1 group2    n1    n2 statistic    df        p p.signif\r\n##   &lt;chr&gt;  &lt;chr&gt;  &lt;chr&gt;  &lt;int&gt; &lt;int&gt;     &lt;dbl&gt; &lt;dbl&gt;    &lt;dbl&gt; &lt;chr&gt;   \r\n## 1 weight F      M         20    20     -20.8  26.9 4.30e-18 ****<\/code><\/pre>\n<p>Si vous voulez supposer l\u2019\u00e9galit\u00e9 des variances (test t de Student), sp\u00e9cifiez l\u2019option <code>var.equal = TRUE<\/code>:<\/p>\n<pre class=\"r\"><code>stat.test2 &lt;- genderweight %&gt;%\r\n  t_test(weight ~ group, var.equal = TRUE) %&gt;%\r\n  add_significance()\r\nstat.test2<\/code><\/pre>\n<p>Le r\u00e9sultat est similaire au r\u00e9sultat d\u2019un test pour \u00e9chantillon unique. Rappelons que plus de d\u00e9tails peuvent \u00eatre obtenus en sp\u00e9cifiant l\u2019option <code>detailed = TRUE<\/code> in the function <code>t_test()<\/code>. La p-value de la comparaison est significative (p &lt; 0,0001).<\/p>\n<\/div>\n<div id=\"taille-de-leffet-1\" class=\"section level3\">\n<h3>Taille de l\u2019effet<\/h3>\n<div id=\"d-de-cohen-pour-le-test-t-de-student\" class=\"section level4\">\n<h4>d de Cohen pour le test t de Student<\/h4>\n<p>Cette valeur de l\u2019effet est calcul\u00e9e en divisant la diff\u00e9rence moyenne entre les groupes par l\u2019\u00e9cart-type regroup\u00e9.<\/p>\n<p>La formule du d de Cohen:<\/p>\n<p><code>d = (mean1 - mean2)\/pooled.sd<\/code>, o\u00f9:<\/p>\n<ul>\n<li><code>pooled.sd<\/code> est l\u2019\u00e9cart-type commun des deux groupes. <code>pooled.sd = sqrt([var1*(n1-1) + var2*(n2-1)]\/[n1 + n2 -2])<\/code>;<\/li>\n<li><code>var1<\/code> et <code>var2<\/code> sont les variances (\u00e9cart-type au carr\u00e9) du groupe 1 et du groupe 2, respectivement.<\/li>\n<li><code>n1<\/code> et <code>n2<\/code> sont les nombres d\u2019\u00e9chantillons pour les groupes 1 et 2, respectivement.<\/li>\n<li><code>mean1<\/code> et <code>mean2<\/code> sont les moyennes de chaque groupe, respectivement.<\/li>\n<\/ul>\n<p>Calculs:<\/p>\n<pre class=\"r\"><code>genderweight %&gt;%  cohens_d(weight ~ group, var.equal = TRUE)<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 7\r\n##   .y.    group1 group2 effsize    n1    n2 magnitude\r\n## * &lt;chr&gt;  &lt;chr&gt;  &lt;chr&gt;    &lt;dbl&gt; &lt;int&gt; &lt;int&gt; &lt;ord&gt;    \r\n## 1 weight F      M         6.57    20    20 large<\/code><\/pre>\n<div class=\"success\">\n<p>L\u2019ampleur de l\u2019effet est importante, d = 6,57.<\/p>\n<\/div>\n<\/div>\n<div id=\"le-d-de-cohen-pour-le-test-t-de-welch\" class=\"section level4\">\n<h4>Le d de Cohen pour le test t de Welch<\/h4>\n<p>Le test de Welch est une variante du test t utilis\u00e9 lorsque l\u2019\u00e9galit\u00e9 de variance ne peut \u00eatre pr\u00e9sum\u00e9e. La valeur de l\u2019effet peut \u00eatre calcul\u00e9e en divisant la diff\u00e9rence moyenne entre les groupes par l\u2019\u00e9cart type \u201cmoyen\u201d.<\/p>\n<p>La formule du d de Cohen:<\/p>\n<p><code>d = (mean1 - mean2)\/sqrt((var1 + var2)\/2)<\/code>, o\u00f9:<\/p>\n<ul>\n<li><code>mean1<\/code> et <code>mean2<\/code> sont les moyennes de chaque groupe, respectivement<\/li>\n<li><code>var1<\/code> et <code>var2<\/code> sont la variance des deux groupes.<\/li>\n<\/ul>\n<p>Calculs:<\/p>\n<pre class=\"r\"><code>genderweight %&gt;% cohens_d(weight ~ group, var.equal = FALSE)<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 7\r\n##   .y.    group1 group2 effsize    n1    n2 magnitude\r\n## * &lt;chr&gt;  &lt;chr&gt;  &lt;chr&gt;    &lt;dbl&gt; &lt;int&gt; &lt;int&gt; &lt;ord&gt;    \r\n## 1 weight F      M         6.57    20    20 large<\/code><\/pre>\n<div class=\"warning\">\n<p>Notez que, lorsque la taille des groupes est \u00e9gale et que les variances des groupes sont homog\u00e8nes, le d de Cohen pour les tests t standard de Student et de Welch sont identiques.<\/p>\n<\/div>\n<\/div>\n<\/div>\n<div id=\"rapporter-1\" class=\"section level3\">\n<h3>Rapporter<\/h3>\n<p>Nous pourrions rapporter le r\u00e9sultat comme suit:<\/p>\n<p>Le poids moyen dans le groupe des femmes \u00e9tait de 63,5 (SD = 2,03), alors que la moyenne dans le groupe des hommes \u00e9tait de 85,8 (SD = 4,3). Le test t de Welch a montr\u00e9 que la diff\u00e9rence \u00e9tait statistiquement significative, t(26.9) = -20.8, p &lt; 0.0001, d = 6.57 ; o\u00f9, t(26.9) est une notation abr\u00e9g\u00e9e pour une statistique t de Welch qui a 26.9 degr\u00e9s de libert\u00e9.<\/p>\n<pre class=\"r\"><code>stat.test &lt;- stat.test %&gt;% add_xy_position(x = \"group\")\r\nbxp + \r\n  stat_pvalue_manual(stat.test, tip.length = 0) +\r\n  labs(subtitle = get_test_label(stat.test, detailed = TRUE))<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-two-sample-box-plot-with-p-values-1.png\" width=\"412.8\" \/><\/p>\n<\/div>\n<\/div>\n<div id=\"pstt\" class=\"section level2\">\n<h2>T-test pour \u00e9chantillons appari\u00e9s<\/h2>\n<p>Le <strong>test t pour \u00e9chantillons appari\u00e9s<\/strong> est utilis\u00e9 pour comparer les moyennes de deux groupes d\u2019\u00e9chantillons appari\u00e9s. En d\u2019autres termes, il est utilis\u00e9 dans une situation o\u00f9 vous avez deux paires de valeurs mesur\u00e9es pour les m\u00eames \u00e9chantillons.<\/p>\n<p>Par exemple, vous pouvez comparer le poids moyen de 20 souris avant et apr\u00e8s le traitement. Les donn\u00e9es contiennent 20 ensembles de valeurs avant traitement et 20 ensembles de valeurs apr\u00e8s traitement provenant de la double mesure du poids d\u2019une m\u00eame souris. Dans de telles situations, le test t-test par paires peut \u00eatre utilis\u00e9 pour comparer les poids moyens avant et apr\u00e8s le traitement.<\/p>\n<div id=\"donnees-de-demonstration-2\" class=\"section level3\">\n<h3>Donn\u00e9es de d\u00e9monstration<\/h3>\n<p>Ici, nous utiliserons un jeu de donn\u00e9es de d\u00e9monstration <code>mice2<\/code> [package datarium], qui contient le poids de 10 souris avant et apr\u00e8s le traitement.<\/p>\n<pre class=\"r\"><code># Format large\r\ndata(\"mice2\", package = \"datarium\")\r\nhead(mice2, 3)<\/code><\/pre>\n<pre><code>##   id before after\r\n## 1  1    187   430\r\n## 2  2    194   404\r\n## 3  3    232   406<\/code><\/pre>\n<pre class=\"r\"><code># Transformez en donn\u00e9es longues : \r\n# rassembler les valeurs de `before` (avant) et `after` (apr\u00e8s) dans la m\u00eame colonne\r\nmice2.long &lt;- mice2 %&gt;%\r\n  gather(key = \"group\", value = \"weight\", before, after)\r\nhead(mice2.long, 3)<\/code><\/pre>\n<pre><code>##   id  group weight\r\n## 1  1 before    187\r\n## 2  2 before    194\r\n## 3  3 before    232<\/code><\/pre>\n<\/div>\n<div id=\"statistiques-descriptives-2\" class=\"section level3\">\n<h3>Statistiques descriptives<\/h3>\n<p>Calculer quelques statistiques descriptives (moyenne et sd) par groupe:<\/p>\n<pre class=\"r\"><code>mice2.long %&gt;%\r\n  group_by(group) %&gt;%\r\n  get_summary_stats(weight, type = \"mean_sd\")<\/code><\/pre>\n<pre><code>## # A tibble: 2 x 5\r\n##   group  variable     n  mean    sd\r\n##   &lt;chr&gt;  &lt;chr&gt;    &lt;dbl&gt; &lt;dbl&gt; &lt;dbl&gt;\r\n## 1 after  weight      10  400.  30.1\r\n## 2 before weight      10  201.  20.0<\/code><\/pre>\n<\/div>\n<div id=\"visualisation-2\" class=\"section level3\">\n<h3>Visualisation<\/h3>\n<pre class=\"r\"><code>bxp &lt;- ggpaired(mice2.long, x = \"group\", y = \"weight\", \r\n         order = c(\"before\", \"after\"),\r\n         ylab = \"Weight\", xlab = \"Groups\")\r\nbxp<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-paired-t-test-box-plot-1.png\" width=\"364.8\" \/><\/p>\n<\/div>\n<div id=\"hypotheses-et-tests-preliminaires-2\" class=\"section level3\">\n<h3>Hypoth\u00e8ses et tests pr\u00e9liminaires<\/h3>\n<p>Le test t des \u00e9chantillons appari\u00e9s suppose les caract\u00e9ristiques suivantes au sujet des donn\u00e9es:<\/p>\n<ul>\n<li><strong>les deux groupes sont appari\u00e9s<\/strong>. Dans notre exemple, c\u2019est le cas puisque les donn\u00e9es ont \u00e9t\u00e9 recueillies en mesurant deux fois le poids des m\u00eames souris.<\/li>\n<li><strong>Aucune valeur aberrante significative<\/strong> dans la diff\u00e9rence entre les deux groupes appari\u00e9s<\/li>\n<li><strong>Normalit\u00e9<\/strong>. la diff\u00e9rence des paires suit une distribution normale.<\/li>\n<\/ul>\n<p>Dans cette section, nous effectuerons quelques tests pr\u00e9liminaires pour v\u00e9rifier si ces hypoth\u00e8ses sont respect\u00e9es.<\/p>\n<p>Tout d\u2019abord, commencez par calculer la diff\u00e9rence entre les groupes:<\/p>\n<pre class=\"r\"><code>mice2 &lt;- mice2 %&gt;% mutate(differences = before - after)\r\nhead(mice2, 3)<\/code><\/pre>\n<pre><code>##   id before after differences\r\n## 1  1    187   430        -242\r\n## 2  2    194   404        -210\r\n## 3  3    232   406        -174<\/code><\/pre>\n<div id=\"identifier-les-valeurs-aberrantes-1\" class=\"section level4\">\n<h4>Identifier les valeurs aberrantes<\/h4>\n<pre class=\"r\"><code>mice2 %&gt;% identify_outliers(differences)<\/code><\/pre>\n<pre><code>## [1] id          before      after       differences is.outlier  is.extreme \r\n## &lt;0 rows&gt; (or 0-length row.names)<\/code><\/pre>\n<div class=\"success\">\n<p>Il n\u2019y avait pas de valeurs extr\u00eames aberrantes.<\/p>\n<\/div>\n<\/div>\n<div id=\"verifier-lhypothese-de-normalite-1\" class=\"section level4\">\n<h4>V\u00e9rifier l\u2019hypoth\u00e8se de normalit\u00e9<\/h4>\n<pre class=\"r\"><code># Test de normalit\u00e9 de Shapiro-Wilk test pour les diff\u00e9rences\r\nmice2 %&gt;% shapiro_test(differences) <\/code><\/pre>\n<pre><code>## # A tibble: 1 x 3\r\n##   variable    statistic     p\r\n##   &lt;chr&gt;           &lt;dbl&gt; &lt;dbl&gt;\r\n## 1 differences     0.968 0.867<\/code><\/pre>\n<pre class=\"r\"><code># QQ plot de la diff\u00e9rence\r\nggqqplot(mice2, \"differences\")<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-paired-samples-normality-assumption-1.png\" width=\"288\" \/><\/p>\n<div class=\"success\">\n<p>D\u2019apr\u00e8s les donn\u00e9es de sortie ci-dessus, on peut supposer que les diff\u00e9rences sont normalement distribu\u00e9es.<\/p>\n<\/div>\n<\/div>\n<\/div>\n<div id=\"calculs-2\" class=\"section level3\">\n<h3>Calculs<\/h3>\n<p>Nous voulons savoir s\u2019il y a une diff\u00e9rence significative dans les poids moyens apr\u00e8s le traitement ?<\/p>\n<pre class=\"r\"><code>stat.test &lt;- mice2.long  %&gt;% \r\n  t_test(weight ~ group, paired = TRUE) %&gt;%\r\n  add_significance()\r\nstat.test<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 9\r\n##   .y.    group1 group2    n1    n2 statistic    df             p p.signif\r\n##   &lt;chr&gt;  &lt;chr&gt;  &lt;chr&gt;  &lt;int&gt; &lt;int&gt;     &lt;dbl&gt; &lt;dbl&gt;         &lt;dbl&gt; &lt;chr&gt;   \r\n## 1 weight after  before    10    10      25.5     9 0.00000000104 ****<\/code><\/pre>\n<p>Le r\u00e9sultat est similaire \u00e0 celui d\u2019un test t pour \u00e9chantillon unique. Encore une fois, plus de d\u00e9tails peuvent \u00eatre obtenus en sp\u00e9cifiant l\u2019option <code>detailed = TRUE<\/code> dans la fonction <code>t_test()<\/code>.<\/p>\n<\/div>\n<div id=\"taille-de-leffet-2\" class=\"section level3\">\n<h3>Taille de l\u2019effet<\/h3>\n<p>La taille de l\u2019effet d\u2019un test t pour \u00e9chantillons appari\u00e9s peut \u00eatre calcul\u00e9e en divisant la diff\u00e9rence moyenne par l\u2019\u00e9cart-type de la diff\u00e9rence, comme indiqu\u00e9 ci-dessous.<\/p>\n<p>La formule de Cohen:<\/p>\n<p><code>d = mean(D)\/sd(D)<\/code>, o\u00f9 <code>D<\/code> est la diff\u00e9rence entre les valeurs des \u00e9chantillons appari\u00e9s.<\/p>\n<p>Calculs:<\/p>\n<pre class=\"r\"><code>mice2.long  %&gt;% cohens_d(weight ~ group, paired = TRUE)<\/code><\/pre>\n<pre><code>## # A tibble: 1 x 7\r\n##   .y.    group1 group2 effsize    n1    n2 magnitude\r\n## * &lt;chr&gt;  &lt;chr&gt;  &lt;chr&gt;    &lt;dbl&gt; &lt;int&gt; &lt;int&gt; &lt;ord&gt;    \r\n## 1 weight after  before    8.08    10    10 large<\/code><\/pre>\n<div class=\"success\">\n<p>La taille de l\u2019effet est importante, d de Cohen = 8,07.<\/p>\n<\/div>\n<\/div>\n<div id=\"rapporter-2\" class=\"section level3\">\n<h3>Rapporter<\/h3>\n<p>Nous pourrions rapporter les r\u00e9sultats comme suit : Le poids moyen des souris a augment\u00e9 de fa\u00e7on significative apr\u00e8s le traitement, t(9) = 25,5, p &lt; 0,0001, d = 8,07.<\/p>\n<pre class=\"r\"><code>stat.test &lt;- stat.test %&gt;% add_xy_position(x = \"group\")\r\nbxp + \r\n  stat_pvalue_manual(stat.test, tip.length = 0) +\r\n  labs(subtitle = get_test_label(stat.test, detailed= TRUE))<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/dn-tutorials\/r-statistics-2-comparing-groups-means\/figures\/031-t-test-paired-t-test-box-plot-with-p-values-1.png\" width=\"364.8\" \/><\/p>\n<\/div>\n<\/div>\n<div id=\"resume\" class=\"section level2\">\n<h2>R\u00e9sum\u00e9<\/h2>\n<p>Ce chapitre d\u00e9crit comment comparer deux moyennes dans R en utilisant le test t. Les codes R \u00e0 d\u00e9marrage rapide, pour calculer les diff\u00e9rents t-tests, sont les suivants:<\/p>\n<pre class=\"r\"><code># Test t pour \u00e9chantillon unique\r\nmice %&gt;% t_test(weight ~ 1, mu = 25)\r\n# T-test pour \u00e9chantillons ind\u00e9pendants\r\ngenderweight %&gt;% t_test(weight ~ group)\r\n# T-test pour \u00e9chantillons appari\u00e9s\r\nmice2.long %&gt;% t_test(weight ~ group, paired = TRUE)<\/code><\/pre>\n<p>Notez que, pour calculer des t-tests unilat\u00e9raux, vous pouvez sp\u00e9cifier l\u2019option <code>alternative<\/code>, dont les valeurs possibles peuvent \u00eatre \u201cgreater\u201d, \u201cless\u201d ou \u201ctwo.sided\u201d.<\/p>\n<p>Nous expliquons \u00e9galement les hypoth\u00e8ses faites par le test t et fournissons des exemples pratiques de codes R pour v\u00e9rifier si les hypoth\u00e8ses du test sont respect\u00e9es.<\/p>\n<p>Les <strong>hypoth\u00e8ses du test t<\/strong> peuvent \u00eatre r\u00e9sum\u00e9es comme suit:<\/p>\n<ul>\n<li>Test t pour \u00e9chantillon unique:\n<ul>\n<li>Aucune valeur aberrante significative dans les donn\u00e9es<\/li>\n<li>les donn\u00e9es doivent \u00eatre normalement distribu\u00e9es.<\/li>\n<\/ul>\n<\/li>\n<li>T-test pour \u00e9chantillon ind\u00e9pendant:\n<ul>\n<li>Aucune valeur aberrante significative dans les groupes<\/li>\n<li>les deux groupes d\u2019\u00e9chantillons (A et B) compar\u00e9s doivent \u00eatre distribu\u00e9s normalement.<\/li>\n<li>les variances des deux groupes ne devraient pas \u00eatre significativement diff\u00e9rentes. Cette hypoth\u00e8se n\u2019est faite que par le test t originel de Student. Elle est relax\u00e9e dans le test t du Welch.<\/li>\n<\/ul>\n<\/li>\n<li>T-test pour \u00e9chantillons appari\u00e9s:\n<ul>\n<li>Aucune valeur aberrante significative dans les diff\u00e9rences entre les groupes<\/li>\n<li>la diff\u00e9rence des paires doit suivre une distribution normale.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p><strong>\u00c9valuer la normalit\u00e9<\/strong>. Avec des \u00e9chantillons suffisamment grands (n &gt; 30), la violation de l\u2019hypoth\u00e8se de normalit\u00e9 ne devrait pas poser de probl\u00e8mes majeurs (selon le th\u00e9or\u00e8me central limite). Cela implique que nous pouvons ignorer la distribution des donn\u00e9es et utiliser des tests param\u00e9triques. Cependant, par souci de logique, le test de Shapiro-Wilk peut \u00eatre utilis\u00e9 pour d\u00e9terminer si les donn\u00e9es montrent ou non un \u00e9cart important par rapport \u00e0 la normalit\u00e9 (voir Chapitre @ref(normalit\u00e9-test-in-r)).<\/p>\n<p><strong>\u00c9valuer l\u2019\u00e9galit\u00e9 des variances<\/strong>. L\u2019homog\u00e9n\u00e9it\u00e9 des variances peut \u00eatre v\u00e9rifi\u00e9e \u00e0 l\u2019aide du test de Levene. Notez que, par d\u00e9faut, la fonction <code>t_test()<\/code> n\u2019assume pas l\u2019\u00e9galit\u00e9 des variances ; au lieu du test t standard de Student, elle utilise le test t de Welch par d\u00e9faut, qui est le plus prudent. Pour utiliser le test t de Student, d\u00e9finissez <code>var.equal = TRUE<\/code>. Les deux m\u00e9thodes donnent des r\u00e9sultats tr\u00e8s semblables, \u00e0 moins que la taille des groupes et les \u00e9carts-types ne soient tr\u00e8s diff\u00e9rents.<\/p>\n<div class=\"warning\">\n<p>Dans les cas o\u00f9 les hypoth\u00e8ses ne sont pas respect\u00e9es, des tests non param\u00e9triques, comme le test de Wilcoxon, sont recommand\u00e9s.<\/p>\n<\/div>\n<\/div>\n<div id=\"references\" class=\"section level2 unnumbered\">\n<h2>References<\/h2>\n<div id=\"refs\" class=\"references\">\n<div id=\"ref-cohen1998\">\n<p>Cohen, J. 1998. <em>Statistical Power Analysis for the Behavioral Sciences<\/em>. 2nd ed. Hillsdale, NJ: Lawrence Erlbaum Associates.<\/p>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<p><!--end rdoc--><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ce chapitre d\u00e9crit comment calculer et interpr\u00e9ter les diff\u00e9rents tests t dans R, notamment le test t sur \u00e9chantillon unique, le test t sur \u00e9chantillons ind\u00e9pendants et le test t sur \u00e9chantillons appari\u00e9s.<\/p>\n","protected":false},"author":1,"featured_media":11055,"parent":0,"menu_order":0,"comment_status":"open","ping_status":"closed","template":"","class_list":["post-11054","dt_lessons","type-dt_lessons","status-publish","has-post-thumbnail","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v25.2 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Test T dans R: Excellente R\u00e9f\u00e9rence - Datanovia<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Test T dans R: Excellente R\u00e9f\u00e9rence - Datanovia\" \/>\n<meta property=\"og:description\" content=\"Ce chapitre d\u00e9crit comment calculer et interpr\u00e9ter les diff\u00e9rents tests t dans R, notamment le test t sur \u00e9chantillon unique, le test t sur \u00e9chantillons ind\u00e9pendants et le test t sur \u00e9chantillons appari\u00e9s.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/\" \/>\n<meta property=\"og:site_name\" content=\"Datanovia\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2019\/05\/X26231190_568106810195934_3157394220874143808_n.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1024\" \/>\n\t<meta property=\"og:image:height\" content=\"512\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data1\" content=\"20 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/\",\"url\":\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/\",\"name\":\"Test T dans R: Excellente R\u00e9f\u00e9rence - Datanovia\",\"isPartOf\":{\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2019\/05\/X26231190_568106810195934_3157394220874143808_n.jpg\",\"datePublished\":\"2019-12-07T22:20:15+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#primaryimage\",\"url\":\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2019\/05\/X26231190_568106810195934_3157394220874143808_n.jpg\",\"contentUrl\":\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2019\/05\/X26231190_568106810195934_3157394220874143808_n.jpg\",\"width\":1024,\"height\":512},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/www.datanovia.com\/en\/fr\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Le\u00e7ons\",\"item\":\"https:\/\/www.datanovia.com\/en\/fr\/lessons\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Test T dans R\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/#website\",\"url\":\"https:\/\/www.datanovia.com\/en\/fr\/\",\"name\":\"Datanovia\",\"description\":\"Exploration de Donn\u00e9es et Statistiques pour l'Aide \u00e0 la D\u00e9cision\",\"publisher\":{\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.datanovia.com\/en\/fr\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/#organization\",\"name\":\"Datanovia\",\"url\":\"https:\/\/www.datanovia.com\/en\/fr\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2018\/09\/datanovia-logo.png\",\"contentUrl\":\"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2018\/09\/datanovia-logo.png\",\"width\":98,\"height\":99,\"caption\":\"Datanovia\"},\"image\":{\"@id\":\"https:\/\/www.datanovia.com\/en\/fr\/#\/schema\/logo\/image\/\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Test T dans R: Excellente R\u00e9f\u00e9rence - Datanovia","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/","og_locale":"fr_FR","og_type":"article","og_title":"Test T dans R: Excellente R\u00e9f\u00e9rence - Datanovia","og_description":"Ce chapitre d\u00e9crit comment calculer et interpr\u00e9ter les diff\u00e9rents tests t dans R, notamment le test t sur \u00e9chantillon unique, le test t sur \u00e9chantillons ind\u00e9pendants et le test t sur \u00e9chantillons appari\u00e9s.","og_url":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/","og_site_name":"Datanovia","og_image":[{"width":1024,"height":512,"url":"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2019\/05\/X26231190_568106810195934_3157394220874143808_n.jpg","type":"image\/jpeg"}],"twitter_card":"summary_large_image","twitter_misc":{"Dur\u00e9e de lecture estim\u00e9e":"20 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/","url":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/","name":"Test T dans R: Excellente R\u00e9f\u00e9rence - Datanovia","isPartOf":{"@id":"https:\/\/www.datanovia.com\/en\/fr\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#primaryimage"},"image":{"@id":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#primaryimage"},"thumbnailUrl":"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2019\/05\/X26231190_568106810195934_3157394220874143808_n.jpg","datePublished":"2019-12-07T22:20:15+00:00","breadcrumb":{"@id":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/"]}]},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#primaryimage","url":"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2019\/05\/X26231190_568106810195934_3157394220874143808_n.jpg","contentUrl":"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2019\/05\/X26231190_568106810195934_3157394220874143808_n.jpg","width":1024,"height":512},{"@type":"BreadcrumbList","@id":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/test-t-dans-r\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.datanovia.com\/en\/fr\/"},{"@type":"ListItem","position":2,"name":"Le\u00e7ons","item":"https:\/\/www.datanovia.com\/en\/fr\/lessons\/"},{"@type":"ListItem","position":3,"name":"Test T dans R"}]},{"@type":"WebSite","@id":"https:\/\/www.datanovia.com\/en\/fr\/#website","url":"https:\/\/www.datanovia.com\/en\/fr\/","name":"Datanovia","description":"Exploration de Donn\u00e9es et Statistiques pour l'Aide \u00e0 la D\u00e9cision","publisher":{"@id":"https:\/\/www.datanovia.com\/en\/fr\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.datanovia.com\/en\/fr\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR"},{"@type":"Organization","@id":"https:\/\/www.datanovia.com\/en\/fr\/#organization","name":"Datanovia","url":"https:\/\/www.datanovia.com\/en\/fr\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/www.datanovia.com\/en\/fr\/#\/schema\/logo\/image\/","url":"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2018\/09\/datanovia-logo.png","contentUrl":"https:\/\/www.datanovia.com\/en\/wp-content\/uploads\/2018\/09\/datanovia-logo.png","width":98,"height":99,"caption":"Datanovia"},"image":{"@id":"https:\/\/www.datanovia.com\/en\/fr\/#\/schema\/logo\/image\/"}}]}},"multi-rating":{"mr_rating_results":[]},"_links":{"self":[{"href":"https:\/\/www.datanovia.com\/en\/fr\/wp-json\/wp\/v2\/dt_lessons\/11054","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.datanovia.com\/en\/fr\/wp-json\/wp\/v2\/dt_lessons"}],"about":[{"href":"https:\/\/www.datanovia.com\/en\/fr\/wp-json\/wp\/v2\/types\/dt_lessons"}],"author":[{"embeddable":true,"href":"https:\/\/www.datanovia.com\/en\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.datanovia.com\/en\/fr\/wp-json\/wp\/v2\/comments?post=11054"}],"version-history":[{"count":0,"href":"https:\/\/www.datanovia.com\/en\/fr\/wp-json\/wp\/v2\/dt_lessons\/11054\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.datanovia.com\/en\/fr\/wp-json\/wp\/v2\/media\/11055"}],"wp:attachment":[{"href":"https:\/\/www.datanovia.com\/en\/fr\/wp-json\/wp\/v2\/media?parent=11054"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}