Cet article décrit comment publier un exemple reproductible de script R sur le site web Datanovia en utilisant le package pubr
.
Le but du package R pubr
est de convertir des scripts R et des contenus Rmd reproductibles en un bloc HTML publiable. Il permet de partager facilement le code R reproductible dans les commentaires de sites web (wordpress) et les articles de blog.
Vous apprendrez de nombreux exemples pour la publication de scripts R reproductibles.
Sommaire:
Prérequis
Installez le package pubr
:
if(require(devtools)) install.packages("devtools")
devtools::install_github("kassambara/pubr")
Charger le package:
library("pubr")
Notez que, si vous utilisez Rstudio sur linux, assurez-vous d’avoir installé les dépendances systèmes suivantes qui facilitent l’interaction avec le presse-papiers: xclip
or xsel
. Cela peut être installé en utilisant par exemple apt-get install xclip
dans le terminal bash.
Principales exigences
- Inclure des données de démonstration, qui peuvent être des [données intégrées dans R] (https://stat.ethz.ch/R-manual/R-patched/library/datasets/html/00Index.html) ou un échantillon de vos propres données. Voici des exemples de jeux de données intégrés dans R:
ToothGrowth
,PlantGrowth
,mtcars
andiris
- Inclure le minimum de commandes nécessaires
- Inclure les “informations de session”:
pubr::render_r(session_info = TRUE)
- Utilisez [un bon style de codage R] (https://www.datanovia.com/en/blog/r-coding-style-best-practices/)
Oui, la création d’un bon exemple reproductible (reprex
) demande du travail. Vous demandez à d’autres personnes de faire le travail aussi. Il s’agit d’un partenariat.
Dans 80% des cas, vous résoudrez votre propre problème en rédigeant un excellent exemple reproductible.
Dans les 20 % du temps restant, vous créerez un example reproductible qui incitera plus facilement les autres à répondre.
Exemple 1 : Script R reproductible utilisant les données intégrées dans R
- Ecrire un script R pur dans Rstudio
- Sélectionnez et copiez le script
- Executer
pubr::render_r()
. Le résultat du script R rendu est un bloc HTML, qui est automatiquement copié dans le presse-papiers. - Coller dans les zones de commentaires d’un site web ou dans un article de blog
# Charger le package requis
suppressPackageStartupMessages(library(ggpubr))
# Préparation des données
data("ToothGrowth")
df <- ToothGrowth
df$dose <-as.factor(df)
# Créer un boxplot
ggboxplot(df, x = "dose", y = "len")
Exemple 2 : Script R reproductible utilisant les données du presse-papiers
- Ecrire un script R pur dans Rstudio
- Copiez les données d’une feuille de calcul Excel et collez-les dans R à l’aide de la fonction
pubr::paste_data()
- Sélectionnez et copiez le script
- Executer
pubr::render_r()
. Le résultat du script R rendu est un bloc HTML, qui est automatiquement copié dans le presse-papiers. - Coller dans une zone de commentaire du site web ou dans un article de blog
# Préparation des données
df <- pubr::paste_data()
# Statistiques descriptives
summary(df)
Exemple 3 : Script R reproductible utilisant un fichier extern de données
- Ecrire un script R pur dans Rstudio
- Collez vos données dans R en utilisant la fonction
pubr::paste_data(data_file)
- Sélectionnez et copiez le script
- Executer
pubr::render_r()
. Le résultat du script R rendu est un bloc HTML, qui est automatiquement copié dans le presse-papiers. - Coller dans une zone de commentaire du site web ou dans un article de blog
# Préparation des données
data_file <-system.file("demo_data", "toothgrowth.txt", package = "pubr")
df <- pubr::paste_data(data_file)
# Créer un boxplot
summary(df)
Exemple 4 : Rendre un Rmd reproductible
- Écrivez un Rmd (sans en-tête yaml) à partir de Rstudio
- Sélectionnez et copiez le contenu du Rmd
- Executer
pubr::render_rmd()
. La sortie du contenu Rmd rendu est un bloc HTML, qui est automatiquement copié dans le presse-papiers. - Coller dans une zone de commentaire du site web ou dans un article de blog
Version: English
No Comments