Publier des Exemples Reproductibles de Scripts R sur Datanovia

Render R script using built-in data


Publier des Exemples Reproductibles de Scripts R sur Datanovia

Cet article décrit comment publier un exemple reproductible de script R sur le site web Datanovia en utilisant le package pubr.

Le but du package R pubr est de convertir des scripts R et des contenus Rmd reproductibles en un bloc HTML publiable. Il permet de partager facilement le code R reproductible dans les commentaires de sites web (wordpress) et les articles de blog.

Vous apprendrez de nombreux exemples pour la publication de scripts R reproductibles.



Sommaire:

Prérequis

Installez le package pubr:

if(require(devtools)) install.packages("devtools")
devtools::install_github("kassambara/pubr")

Charger le package:

library("pubr")

Notez que, si vous utilisez Rstudio sur linux, assurez-vous d’avoir installé les dépendances systèmes suivantes qui facilitent l’interaction avec le presse-papiers: xclip or xsel. Cela peut être installé en utilisant par exemple apt-get install xclip dans le terminal bash.

Principales exigences

  1. Inclure des données de démonstration, qui peuvent être des [données intégrées dans R] (https://stat.ethz.ch/R-manual/R-patched/library/datasets/html/00Index.html) ou un échantillon de vos propres données. Voici des exemples de jeux de données intégrés dans R: ToothGrowth, PlantGrowth, mtcars and iris
  2. Inclure le minimum de commandes nécessaires
  3. Inclure les “informations de session”: pubr::render_r(session_info = TRUE)
  4. Utilisez [un bon style de codage R] (https://www.datanovia.com/en/blog/r-coding-style-best-practices/)

Oui, la création d’un bon exemple reproductible (reprex) demande du travail. Vous demandez à d’autres personnes de faire le travail aussi. Il s’agit d’un partenariat.

Dans 80% des cas, vous résoudrez votre propre problème en rédigeant un excellent exemple reproductible.

Dans les 20 % du temps restant, vous créerez un example reproductible qui incitera plus facilement les autres à répondre.

Exemple 1 : Script R reproductible utilisant les données intégrées dans R

  1. Ecrire un script R pur dans Rstudio
  2. Sélectionnez et copiez le script
  3. Executer pubr::render_r(). Le résultat du script R rendu est un bloc HTML, qui est automatiquement copié dans le presse-papiers.
  4. Coller dans les zones de commentaires d’un site web ou dans un article de blog
# Charger le package requis
suppressPackageStartupMessages(library(ggpubr))

# Préparation des données
data("ToothGrowth")
df <- ToothGrowth
df$dose <-as.factor(df)

# Créer un boxplot
ggboxplot(df, x = "dose", y = "len")

Rendre un script R en utilisant des données intégrées

Exemple 2 : Script R reproductible utilisant les données du presse-papiers

  1. Ecrire un script R pur dans Rstudio
  2. Copiez les données d’une feuille de calcul Excel et collez-les dans R à l’aide de la fonction pubr::paste_data()
  3. Sélectionnez et copiez le script
  4. Executer pubr::render_r(). Le résultat du script R rendu est un bloc HTML, qui est automatiquement copié dans le presse-papiers.
  5. Coller dans une zone de commentaire du site web ou dans un article de blog
# Préparation des données
df <- pubr::paste_data()

# Statistiques descriptives
summary(df)

Rendre le script R en utilisant les données du presse-papiers

Exemple 3 : Script R reproductible utilisant un fichier extern de données

  1. Ecrire un script R pur dans Rstudio
  2. Collez vos données dans R en utilisant la fonction pubr::paste_data(data_file)
  3. Sélectionnez et copiez le script
  4. Executer pubr::render_r(). Le résultat du script R rendu est un bloc HTML, qui est automatiquement copié dans le presse-papiers.
  5. Coller dans une zone de commentaire du site web ou dans un article de blog
# Préparation des données
data_file <-system.file("demo_data", "toothgrowth.txt", package = "pubr")
df <- pubr::paste_data(data_file)

# Créer un boxplot
summary(df)

Exemple 4 : Rendre un Rmd reproductible

  1. Écrivez un Rmd (sans en-tête yaml) à partir de Rstudio
  2. Sélectionnez et copiez le contenu du Rmd
  3. Executer pubr::render_rmd(). La sortie du contenu Rmd rendu est un bloc HTML, qui est automatiquement copié dans le presse-papiers.
  4. Coller dans une zone de commentaire du site web ou dans un article de blog

Rendre des contenus Rmd



Version: English





No Comments

Give a comment

Want to post an issue with R? If yes, please make sure you have read this: How to Include Reproducible R Script Examples in Datanovia Comments