library(ggplot2)
# Erzeugen von Beispieldaten
set.seed(123)
<- data.frame(x = rnorm(100), y = rnorm(100))
df
# Erstellen eines Streudiagramms mit ggplot2
ggplot(df, aes(x = x, y = y)) +
geom_point(color = "darkblue") +
labs(title = "Streudiagramm (ggplot2)", x = "X-axis", y = "Y-axis") +
theme_minimal()
Einführung
Die Erstellung effektiver Visualisierungen ist der Schlüssel zur Vermittlung von Datenkenntnissen. Viele R-Benutzer sind mit ggplot2 vertraut, einem leistungsstarken Visualisierungspaket, das auf der Grammatik der Grafik aufbaut. Auf der Python-Seite sind matplotlib und Seaborn beliebte Werkzeuge für die Erstellung ähnlicher Diagramme. In diesem Tutorial stellen wir Beispiele für die Erstellung ähnlicher Visualisierungen - wie Streudiagramme, Balken- und Liniendiagramme - in R und Python gegenüber. Dieser Leitfaden soll Ihnen helfen, die Syntaxunterschiede zu verstehen und den besten Ansatz für Ihre Projekte zu wählen.
Vergleichende Beispiele
Nachfolgend finden Sie Beispiele, die mit einem Panel-Tabset dargestellt werden. Jede Registerkarte enthält ein Visualisierungsbeispiel in R (mit ggplot2) und die entsprechende Python-Version (mit matplotlib/Seaborn).
R (ggplot2) Beispiel:
Python (matplotlib & Seaborn) Beispiel:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# Erzeugen von Beispieldaten
123)
np.random.seed(= pd.DataFrame({
df 'x': np.random.randn(100),
'y': np.random.randn(100)
})
# Erstellen eines Streudiagramms mit Seaborn
='x', y='y', data=df, color='darkblue')
sns.scatterplot(x"Streudiagramm (Seaborn)")
plt.title("X-axis")
plt.xlabel("Y-axis")
plt.ylabel(
plt.tight_layout() plt.show()
R (ggplot2) Beispiel:
library(ggplot2)
# Beispieldaten für Balkendiagramm erstellen
<- data.frame(
df_bar category = c("A", "B", "C", "D"),
count = c(23, 17, 35, 29)
)
# Erstellen eines Balkendiagramms mit ggplot2
ggplot(df_bar, aes(x = category, y = count, fill = category)) +
geom_bar(stat = "identity") +
labs(title = "Balkendiagramm (ggplot2)", x = "Category", y = "Count") +
theme_minimal() +
scale_fill_brewer(palette = "Set2")
Python (matplotlib & Seaborn) Beispiel:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Beispieldaten für Balkendiagramm erstellen
= pd.DataFrame({
df_bar 'category': ["A", "B", "C", "D"],
'count': [23, 17, 35, 29]
})
# Erstellen eines Balkendiagramms mit Seaborn
='category', y='count', data=df_bar, palette="Set2")
sns.barplot(x"Balkendiagramm (Seaborn)")
plt.title("Category")
plt.xlabel("Count")
plt.ylabel(
plt.tight_layout() plt.show()
R (ggplot2) Beispiel:
library(ggplot2)
# Beispielhafte Zeitreihendaten generieren
<- data.frame(
df_line date = seq(as.Date("2020-01-01"), by = "month", length.out = 12),
value = cumsum(rnorm(12, mean = 5, sd = 2))
)
# Erstellen eines Liniendiagramms mit ggplot2
ggplot(df_line, aes(x = date, y = value)) +
geom_line(color = "forestgreen", size = 1.2) +
labs(title = "Liniendiagramm (ggplot2)", x = "Date", y = "Value") +
theme_minimal()
Python (matplotlib & Seaborn) Beispiel:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# Beispielhafte Zeitreihendaten generieren
= pd.date_range(start="2020-01-01", periods=12, freq="M")
dates = np.cumsum(np.random.randn(12) * 2 + 5)
values = pd.DataFrame({'date': dates, 'value': values})
df_line
# Erstellen eines Liniendiagramms mit matplotlib
'date'], df_line['value'], color='forestgreen', linewidth=2)
plt.plot(df_line["Liniendiagramm (matplotlib)")
plt.title("Date")
plt.xlabel("Value")
plt.ylabel(
plt.tight_layout() plt.show()
Schlussfolgerung
Sowohl R als auch Python bieten robuste Funktionen für die Datenvisualisierung. Während ggplot2 in R einen Grammatik-der-Grafik-Ansatz bietet, liefern die Python-Bibliotheken matplotlib und Seaborn ähnlich leistungsstarke Werkzeuge mit ihrer eigenen Syntax und Anpassungsoptionen. Durch den Vergleich dieser Beispiele können Sie die Feinheiten der einzelnen Ökosysteme besser verstehen und das beste Toolset für Ihre Datenvisualisierungsanforderungen auswählen.
Weiterführende Literatur
- Python für R-Anwender: Umstellung auf Python für die Datenwissenschaft
- Datenmanipulation in Python vs. R: dplyr vs. pandas
- Machine Learning Workflows: tidymodels vs. scikit-learn
- R-Syntax vs. Python-Syntax: Ein vergleichender Leitfaden
Viel Spaß beim Programmieren und bei der Erstellung schöner Visualisierungen sowohl in R als auch in Python!
Weitere Artikel erkunden
Hier finden Sie weitere Artikel aus derselben Kategorie, die Ihnen helfen, tiefer in das Thema einzutauchen.
Wiederverwendung
Zitat
@online{kassambara2024,
author = {Kassambara, Alboukadel},
title = {Datenvisualisierung für R-Benutzer: ggplot2 vs.
matplotlib/Seaborn},
date = {2024-02-13},
url = {https://www.datanovia.com/de/learn/programming/transition/data-visualization-ggplot2-vs-matplotlib.html},
langid = {de}
}