Datentypen und Strukturen in R

Vektoren, Listen, Datenrahmen und Matrizen behandeln

Lernen Sie, wie Sie mit den wichtigsten Datenstrukturen von R arbeiten - Vektoren, Listen, Datenrahmen und Matrizen. In diesem Tutorial werden die Eigenschaften und Anwendungsfälle der einzelnen Datentypen erläutert und praktische Codebeispiele gegeben.

Programmierung
Autor:in
Zugehörigkeit
Veröffentlichungsdatum

10. Februar 2024

Geändert

29. April 2025

Schlüsselwörter

R-Datentypen, R-Datenstrukturen, R Vektoren, R-Listen, R-Datenrahmen, R-Matrizen

Einführung

R bietet eine Vielzahl von Datenstrukturen, die als Bausteine für die Datenanalyse dienen. In diesem Tutorium werden wir die vier wichtigsten Datentypen in R behandeln:

  • Vektoren: Die grundlegendste Datenstruktur in R.
  • Listen: Vielseitige Sammlungen, die Elemente verschiedener Typen enthalten können.
  • Daten-Frames: Tabellarische Datenstrukturen, ähnlich wie Tabellenkalkulationen oder SQL-Tabellen.
  • Matrizen: Zweidimensionale Arrays, die für numerische Berechnungen verwendet werden.

Das Verständnis dieser Datenstrukturen ist für das Schreiben von effizientem R-Code und die Durchführung effektiver Datenanalysen unerlässlich.



Vektoren

Vektoren sind der einfachste Typ von Datenstrukturen in R. Sie sind geordnete, homogene Sammlungen von Elementen (alle Elemente müssen vom gleichen Typ sein).

Erstellen und Verwenden von Vektoren

# Erstellen eines numerischen Vektors
num_vector <- c(1, 2, 3, 4, 5)
print(num_vector)                         
[1] 1 2 3 4 5
# Erstellen eines Zeichenvektors
char_vector <- c("apple", "banana", "cherry")
print(char_vector)                       
[1] "apple"  "banana" "cherry"
# Grundlegende Operationen mit Vektoren
sum_vector <- sum(num_vector)
print(paste("Sum:", sum_vector))        
[1] "Sum: 15"

Wann werden Vektoren verwendet

Verwenden Sie Vektoren zum Speichern von Zahlenfolgen, Zeichen oder logischen Werten, wenn alle Elemente vom gleichen Typ sind.

Listen

Listen in R sind flexible Datenstrukturen, die Elemente verschiedener Typen enthalten können, einschließlich anderer Listen.

Erstellen und Verwenden von Listen

# Erstellen einer Liste mit verschiedenen Datentypen
my_list <- list(
  name = "Alice",
  age = 25,
  scores = c(85, 90, 95)
)
print(my_list)
$name
[1] "Alice"

$age
[1] 25

$scores
[1] 85 90 95
# Zugriff auf Elemente in einer Liste
print(my_list$name)
[1] "Alice"
print(my_list[[3]])
[1] 85 90 95

Wann man Listen verwenden sollte

Verwenden Sie Listen, wenn Sie heterogene Daten oder eine Sammlung von Objekten speichern müssen, die nicht unbedingt den gleichen Typ haben.

Daten-Frames

Datenrahmen sind zweidimensionale Datenstrukturen, die sich ideal für den Umgang mit tabellarischen Daten eignen. Sie ähneln Tabellenkalkulationen und ermöglichen es, verschiedene Datentypen in jeder Spalte zu speichern.

Erstellen und Verwenden von Datenframes

# Erstellen eines Datenrahmens
students <- data.frame(
  name = c("Alice", "Bob", "Charlie"),
  age = c(25, 30, 35),
  major = c("Biology", "Mathematics", "Computer Science")
)
print(students)
     name age            major
1   Alice  25          Biology
2     Bob  30      Mathematics
3 Charlie  35 Computer Science
# Zugriff auf Spalten in einem Datenrahmen
print(students$name)
[1] "Alice"   "Bob"     "Charlie"

Wann werden Datenrahmen verwendet

Datenrahmen werden am besten bei der Arbeit mit strukturierten, tabellarischen Daten verwendet. Sie sind besonders nützlich in der Datenwissenschaft für Aufgaben wie Datenbereinigung, -transformation und -visualisierung.

Matrizen

Matrizen sind zweidimensionale Arrays, die Elemente eines einzigen Datentyps enthalten. Sie werden hauptsächlich für mathematische Berechnungen verwendet.

Erstellen und Verwenden von Matrizen

# Erstellen einer Matrix aus einem Vektor, Angabe der Anzahl der Zeilen
matrix_data <- matrix(1:9, nrow = 3, byrow = TRUE)
print(matrix_data)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
# Grundlegende Matrixoperationen
matrix_sum <- sum(matrix_data)
print(paste("Matrix Sum:", matrix_sum))
[1] "Matrix Sum: 45"

Wann man Matrizen verwenden sollte

Verwenden Sie Matrizen für numerische Berechnungen, bei denen Sie eine feste zweidimensionale Struktur benötigen, wie z. B. bei Operationen der linearen Algebra.

Schlussfolgerung

Das Verständnis der grundlegenden Datenstrukturen in R - Vektoren, Listen, Datenrahmen und Matrizen - ist entscheidend für eine effektive Datenanalyse. Jede Struktur hat ihre spezifischen Anwendungsfälle, und die Beherrschung dieser Strukturen wird Ihnen helfen, effizienteren und besser lesbaren R-Code zu schreiben. Experimentieren Sie mit diesen Beispielen und erkunden Sie, wie jede Datenstruktur in Ihren eigenen Projekten genutzt werden kann.

Weiterführende Literatur

Viel Spaß beim Programmieren und beim Erforschen der leistungsstarken Datenstrukturen von R!

Verwandte Artikel

Hinweis

Weitere Artikel erkunden

Hinweis

Hier finden Sie weitere Artikel aus derselben Kategorie, die Ihnen helfen, tiefer in das Thema einzutauchen.

placeholder

placeholder
Keine Treffer
Zurück nach oben

Wiederverwendung

Zitat

Mit BibTeX zitieren:
@online{kassambara2024,
  author = {Kassambara, Alboukadel},
  title = {Datentypen und Strukturen in R},
  date = {2024-02-10},
  url = {https://www.datanovia.com/de/learn/programming/r/basics/data-types-and-structures.html},
  langid = {de}
}
Bitte zitieren Sie diese Arbeit als:
Kassambara, Alboukadel. 2024. “Datentypen und Strukturen in R.” February 10, 2024. https://www.datanovia.com/de/learn/programming/r/basics/data-types-and-structures.html.