Visualisation des Données à l'Aide de GGPlot2

GGPLOT Line Plot

Dans un graphique en ligne (ou line plot), les observations sont ordonnées par la valeur sur x et reliées par une ligne.

La valuer x (pour l’axe des x) peut être :

  • date : pour une série chronologique de données
  • textes
  • valeurs numériques discrètes
  • valeurs numériques continues

Cet article décrit comment créer un line plot à l’aide du package ggplot2 dans R

Vous apprendrez à:

  • Créez des line plots de base et groupés
  • Ajouter des points à un line plot
  • Modifier les types de lignes et les couleurs par groupe


Sommaire:

Livre Apparenté

GGPLOT2 - L’Essentiel pour une Visualisation Magnifique des Données dans R

Fonctions R clés

  • Fonctions clés:
    • geom_path() relie les observations dans l’ordre dans lequel elles apparaissent dans les données.
    • geom_line() les relie dans l’ordre de la variable sur l’axe des x.
    • geom_step() crée un graphe en escalier, mettant en évidence exactement quand les changements se produisent.
  • Principaux arguments pour personnaliser le graphique : alpha, color, linetype and size

Préparation des données

Nous allons créer deux data frames dérivées du jeu de données ToothGrowth.

df <- data.frame(dose=c("D0.5", "D1", "D2"),
                len=c(4.2, 10, 29.5))

head(df, 4)
##   dose  len
## 1 D0.5  4.2
## 2   D1 10.0
## 3   D2 29.5
df2 <- data.frame(supp=rep(c("VC", "OJ"), each=3),
                dose=rep(c("D0.5", "D1", "D2"),2),
                len=c(6.8, 15, 33, 4.2, 10, 29.5))

head(df2, 4)
##   supp dose  len
## 1   VC D0.5  6.8
## 2   VC   D1 15.0
## 3   VC   D2 33.0
## 4   OJ D0.5  4.2
  • len: Longueur des dents
  • dose: Dose en milligrammes (0,5, 1, 2)
  • supp: Type de supplément (VC ou OJ)

Chargement des packages R requis

Chargez le package ggplot2 et mettez le thème par défaut à theme_classic() avec la légende en haut du graphique:

library(ggplot2)
theme_set(
  theme_classic() +
    theme(legend.position = "top")
  )

Line plots basiques

p <- ggplot(data = df, aes(x = dose, y = len, group = 1)) 
# Line plot basique avec des points
 p + geom_line() + geom_point()

# Modifier le type et la couleur des lignes
p + geom_line(linetype = "dashed", color = "steelblue")+
  geom_point(color = "steelblue")

# Utiliser geom_step()
p + geom_step() + geom_point()

Notez que l’option group détermine les cas qui sont reliés entre eux.

Line plot avec plusieurs groupes

Dans les graphiques ci-dessous, les types de lignes et les formes de points sont contrôlés automatiquement par les niveaux de la variable supp:

p <- ggplot(df2, aes(x = dose, y = len, group = supp))
# Modifier les types de lignes et les formes de points par groupes
p + geom_line(aes(linetype = supp)) +
    geom_point(aes(shape = supp))

# Modifier les types de lignes, les formes de points et les couleurs
# Changer de couleur manuellement : couleur personnalisée
p + geom_line(aes(linetype = supp, color = supp))+
    geom_point(aes(shape = supp, color = supp)) +
    scale_color_manual(values=c("#999999", "#E69F00"))

Line plot avec un axe x numérique

Si la variable sur l’axe des abscisses est numérique, il peut être utile de la traiter comme une variable continue ou un facteur, selon ce que vous voulez faire:

# Créer des données
df3 <- data.frame(supp=rep(c("VC", "OJ"), each=3),
                dose=rep(c("0.5", "1", "2"),2),
                len=c(6.8, 15, 33, 4.2, 10, 29.5))
head(df3)
##   supp dose  len
## 1   VC  0.5  6.8
## 2   VC    1 15.0
## 3   VC    2 33.0
## 4   OJ  0.5  4.2
## 5   OJ    1 10.0
## 6   OJ    2 29.5
# Axe x traité comme variable continue
df3$dose <- as.numeric(as.vector(df3$dose))
ggplot(data = df3, aes(x = dose, y = len, group = supp, color = supp)) +
  geom_line() + geom_point()

# Axe traité comme variable discrète
df3$dose<-as.factor(df3$dose)
ggplot(data=df3, aes(x = dose, y = len, group = supp, color = supp)) +
  geom_line() + geom_point()

Line plots avec les dates sur l’axe des abscisses : Séries chronologiques

On utilise le jeu de données economics :

head(economics)
## # A tibble: 6 x 6
##   date         pce    pop psavert uempmed unemploy
##   <date>     <dbl>  <dbl>   <dbl>   <dbl>    <dbl>
## 1 1967-07-01  507. 198712    12.6     4.5     2944
## 2 1967-08-01  510. 198911    12.6     4.7     2945
## 3 1967-09-01  516. 199113    11.9     4.6     2958
## 4 1967-10-01  512. 199311    12.9     4.9     3143
## 5 1967-11-01  517. 199498    12.8     4.7     3066
## 6 1967-12-01  525. 199657    11.8     4.8     3018

Graphiques :

# Line plot basique
ggplot(data=economics, aes(x = date, y = pop))+
  geom_line()

# Tracer un sous-ensemble des données
ss <- subset(economics, date > as.Date("2006-1-1"))
ggplot(data = ss, aes(x = date, y = pop)) + geom_line()

Modifier la taille de la ligne :

ggplot(data = economics, aes(x = date, y = pop)) +
  geom_line(aes(size = unemploy/pop))

Tracez plusieurs séries chronologiques de données:

ggplot(economics, aes(x=date)) + 
  geom_line(aes(y = psavert), color = "darkred") + 
  geom_line(aes(y = uempmed), color="steelblue", linetype="twodash") 

# Area plot
ggplot(economics, aes(x=date)) + 
  geom_area(aes(y = psavert), fill = "#999999", 
            color = "#99999999", alpha=0.5) + 
  geom_area(aes(y = uempmed), fill = "#E69F00",
            color = "#E69F00", alpha=0.5) 

Conclusion

Cet article montre comment créer des line plots à l’aide du package ggplot2.



Version: English

GGPlot Stripchart (Prev Lesson)
(Next Lesson) GGPlot Barplot
Back to Visualisation des Données à l’Aide de GGPlot2

No Comments

Give a comment

Want to post an issue with R? If yes, please make sure you have read this: How to Include Reproducible R Script Examples in Datanovia Comments

Teacher
Alboukadel Kassambara
Role : Fondateur de Datanovia
Read More