Dans un graphique en ligne (ou line plot), les observations sont ordonnées par la valeur sur x et reliées par une ligne.
La valuer x (pour l’axe des x) peut être :
- date : pour une série chronologique de données
- textes
- valeurs numériques discrètes
- valeurs numériques continues
Cet article décrit comment créer un line plot à l’aide du package ggplot2 dans R
Vous apprendrez à:
- Créez des line plots de base et groupés
- Ajouter des points à un line plot
- Modifier les types de lignes et les couleurs par groupe
Sommaire:
Livre Apparenté
GGPLOT2 - L’Essentiel pour une Visualisation Magnifique des Données dans RFonctions R clés
- Fonctions clés:
geom_path()
relie les observations dans l’ordre dans lequel elles apparaissent dans les données.geom_line()
les relie dans l’ordre de la variable sur l’axe des x.geom_step()
crée un graphe en escalier, mettant en évidence exactement quand les changements se produisent.
- Principaux arguments pour personnaliser le graphique : alpha, color, linetype and size
Préparation des données
Nous allons créer deux data frames dérivées du jeu de données ToothGrowth
.
df <- data.frame(dose=c("D0.5", "D1", "D2"),
len=c(4.2, 10, 29.5))
head(df, 4)
## dose len
## 1 D0.5 4.2
## 2 D1 10.0
## 3 D2 29.5
df2 <- data.frame(supp=rep(c("VC", "OJ"), each=3),
dose=rep(c("D0.5", "D1", "D2"),2),
len=c(6.8, 15, 33, 4.2, 10, 29.5))
head(df2, 4)
## supp dose len
## 1 VC D0.5 6.8
## 2 VC D1 15.0
## 3 VC D2 33.0
## 4 OJ D0.5 4.2
len
: Longueur des dentsdose
: Dose en milligrammes (0,5, 1, 2)supp
: Type de supplément (VC ou OJ)
Chargement des packages R requis
Chargez le package ggplot2 et mettez le thème par défaut à theme_classic()
avec la légende en haut du graphique:
library(ggplot2)
theme_set(
theme_classic() +
theme(legend.position = "top")
)
Line plots basiques
p <- ggplot(data = df, aes(x = dose, y = len, group = 1))
# Line plot basique avec des points
p + geom_line() + geom_point()
# Modifier le type et la couleur des lignes
p + geom_line(linetype = "dashed", color = "steelblue")+
geom_point(color = "steelblue")
# Utiliser geom_step()
p + geom_step() + geom_point()
Notez que l’option group
détermine les cas qui sont reliés entre eux.
Line plot avec plusieurs groupes
Dans les graphiques ci-dessous, les types de lignes et les formes de points sont contrôlés automatiquement par les niveaux de la variable supp
:
p <- ggplot(df2, aes(x = dose, y = len, group = supp))
# Modifier les types de lignes et les formes de points par groupes
p + geom_line(aes(linetype = supp)) +
geom_point(aes(shape = supp))
# Modifier les types de lignes, les formes de points et les couleurs
# Changer de couleur manuellement : couleur personnalisée
p + geom_line(aes(linetype = supp, color = supp))+
geom_point(aes(shape = supp, color = supp)) +
scale_color_manual(values=c("#999999", "#E69F00"))
Line plot avec un axe x numérique
Si la variable sur l’axe des abscisses est numérique, il peut être utile de la traiter comme une variable continue ou un facteur, selon ce que vous voulez faire:
# Créer des données
df3 <- data.frame(supp=rep(c("VC", "OJ"), each=3),
dose=rep(c("0.5", "1", "2"),2),
len=c(6.8, 15, 33, 4.2, 10, 29.5))
head(df3)
## supp dose len
## 1 VC 0.5 6.8
## 2 VC 1 15.0
## 3 VC 2 33.0
## 4 OJ 0.5 4.2
## 5 OJ 1 10.0
## 6 OJ 2 29.5
# Axe x traité comme variable continue
df3$dose <- as.numeric(as.vector(df3$dose))
ggplot(data = df3, aes(x = dose, y = len, group = supp, color = supp)) +
geom_line() + geom_point()
# Axe traité comme variable discrète
df3$dose<-as.factor(df3$dose)
ggplot(data=df3, aes(x = dose, y = len, group = supp, color = supp)) +
geom_line() + geom_point()
Line plots avec les dates sur l’axe des abscisses : Séries chronologiques
On utilise le jeu de données economics
:
head(economics)
## # A tibble: 6 x 6
## date pce pop psavert uempmed unemploy
## <date> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1967-07-01 507. 198712 12.6 4.5 2944
## 2 1967-08-01 510. 198911 12.6 4.7 2945
## 3 1967-09-01 516. 199113 11.9 4.6 2958
## 4 1967-10-01 512. 199311 12.9 4.9 3143
## 5 1967-11-01 517. 199498 12.8 4.7 3066
## 6 1967-12-01 525. 199657 11.8 4.8 3018
Graphiques :
# Line plot basique
ggplot(data=economics, aes(x = date, y = pop))+
geom_line()
# Tracer un sous-ensemble des données
ss <- subset(economics, date > as.Date("2006-1-1"))
ggplot(data = ss, aes(x = date, y = pop)) + geom_line()
Modifier la taille de la ligne :
ggplot(data = economics, aes(x = date, y = pop)) +
geom_line(aes(size = unemploy/pop))
Tracez plusieurs séries chronologiques de données:
ggplot(economics, aes(x=date)) +
geom_line(aes(y = psavert), color = "darkred") +
geom_line(aes(y = uempmed), color="steelblue", linetype="twodash")
# Area plot
ggplot(economics, aes(x=date)) +
geom_area(aes(y = psavert), fill = "#999999",
color = "#99999999", alpha=0.5) +
geom_area(aes(y = uempmed), fill = "#E69F00",
color = "#E69F00", alpha=0.5)
Conclusion
Cet article montre comment créer des line plots à l’aide du package ggplot2.
Version: English
No Comments