# Erforderliche Pakete
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
Einführung
Seaborn ist eine leistungsstarke Python-Bibliothek, die auf Matplotlib aufbaut und die Erstellung schöner, informativer statistischer Visualisierungen vereinfacht. In diesem Tutorium werden wir uns mit fortgeschrittenen Visualisierungstechniken mit Seaborn beschäftigen, die über das grundlegende Plotten hinausgehen. Sie lernen, wie Sie komplexe Diagramme erstellen, die Ästhetik von Diagrammen anpassen und statistische Erkenntnisse nutzen können - alles maßgeschneidert für Datenwissenschaft-Anwendungen.
Erforderliche Pakete importieren
Um sicherzustellen, dass alle Codeblöcke Zugriff auf die notwendigen Bibliotheken haben, ohne sich zu wiederholen, importieren wir sie zunächst hier:
Seaborn bietet eine Vielzahl kategorialer Diagramme wie Boxplots, Violinplots und Schwarmdiagramme, die dabei helfen, Datenverteilungen über verschiedene Kategorien hinweg aufzuzeigen.
Box Plot und Violin Plot Beispiel
# Erstellen eines Beispiel DataFrame
42)
np.random.seed(= pd.DataFrame({
df "Category": np.random.choice(["A", "B", "C"], size=200),
"Value": np.random.randn(200)
})
# Erstellen eines Box-Plots
="Category", y="Value", data=df)
sns.boxplot(x=10, trim=True)
sns.despine(offset"Box Plot Example")
plt.title(
plt.show()
# Erstellen eines Violinplots
="Category", y="Value", data=df, inner="quartile")
sns.violinplot(x=10, trim=True)
sns.despine(offset"Violin Plot Example")
plt.title( plt.show()
Regression und Streudiagramme
Seaborns Regressionsdiagramme, wie z. B. regplot
, kombinieren Streudiagramme mit linearen Regressionsmodellen, um Ihnen zu helfen, Beziehungen zwischen Variablen zu untersuchen.
Beispiel für eine Regressionsdarstellung
# Laden eines eingebauten Datensatzes aus Seaborn
= sns.load_dataset("mpg")
df # Erstellen einer Regressionsdarstellung
=df, x="weight", y="acceleration", ci=None, scatter_kws={"s": 50, "alpha": 0.7})
sns.regplot(data"Beispiel für eine Regressionsdarstellung")
plt.title( plt.show()
Paardiagramme für multivariate Analysen
Pair Plots bieten eine hervorragende Möglichkeit, Beziehungen zwischen mehreren Variablen in einem Datensatz zu visualisieren.
Beispiel eines Pair Plots
# Laden eines eingebauten Datensatzes aus Seaborn
= sns.load_dataset("iris")
df = ["sepal_length", "sepal_width", "petal_length", "species"]
columns_of_interest = df[columns_of_interest]
df
# Erstellen eines Pair Plots
="species", markers=["o", "s", "D"])
sns.pairplot(df, hue plt.show()
Heatmaps für Korrelationsmatrizen
Heatmaps sind ideal für die Visualisierung von Korrelationsmatrizen und die Identifizierung von Beziehungen zwischen numerischen Variablen.
Heatmap Beispiel
# Laden eines eingebauten Datensatzes aus Seaborn
= sns.load_dataset("glue")
df = df.pivot(index="Model", columns="Task", values="Score")
df
# Berechnen der Korrelationsmatrix
= df.corr()
corr
# Erstellen einer Heatmap der Korrelationsmatrix
=True, cmap="coolwarm", fmt=".2f")
sns.heatmap(corr, annot"Heatmap of Correlation Matrix")
plt.title( plt.show()
Anpassen von Seaborn-Visualisierungen
Seaborn bietet mehrere Anpassungsoptionen, um die Ästhetik Ihrer Diagramme zu verbessern:
- Themes: Verwenden Sie
sns.set_style()
, um das allgemeine Aussehen Ihrer Diagramme zu ändern (z. B.whitegrid
,dark
,ticks
). - Farbpaletten: Experimentieren Sie mit verschiedenen Farbpaletten mit
sns.color_palette()
, um Ihr Branding oder Ihre Präsentationsanforderungen zu erfüllen. - Kontexteinstellungen: Passen Sie den Kontext (z. B.
'paper'
,'notebook'
,'talk'
,'poster'
) mitsns.set_context()
an, um den Maßstab der Diagrammelemente zu steuern.
Schlussfolgerung
Fortgeschrittene Datenvisualisierung mit Seaborn ermöglicht es Ihnen, überzeugende, informative Diagramme zu erstellen, die Ihre Datenanalyse verbessern. Durch die Beherrschung von kategorialen Plots, Regressionsplots, Paarplots und Heatmaps können Sie tiefere Einblicke gewinnen und Ihre Daten auf visuell ansprechende Weise präsentieren. Experimentieren Sie mit diesen Techniken und passen Sie sie an Ihre spezifischen datenwissenschaftlichen Anforderungen an.
Weiterführende Literatur
- Datenvisualisierung mit Matplotlib
- Datenverarbeitung mit Pandas
- Maschinelles Lernen mit Scikit-Learn
Viel Spaß beim Programmieren und bei der Erstellung überzeugender Visualisierungen mit Seaborn!
Weitere Artikel erkunden
Hier finden Sie weitere Artikel aus derselben Kategorie, die Ihnen helfen, tiefer in das Thema einzutauchen.
Wiederverwendung
Zitat
@online{kassambara2024,
author = {Kassambara, Alboukadel},
title = {Datenvisualisierung mit Seaborn},
date = {2024-02-07},
url = {https://www.datanovia.com/de/learn/programming/python/data-science/data-visualization-with-seaborn.html},
langid = {de}
}