Couvrir les vecteurs, les listes, les cadres de données et les matrices
Apprenez à travailler avec les principales structures de données de R : vecteurs, listes, cadres de données et matrices. Ce tutoriel explique les propriétés et les cas d’utilisation de chaque type de données et fournit des exemples de code pratiques.
R offre un riche ensemble de structures de données qui constituent les éléments de base de l’analyse des données. Dans ce tutoriel, nous aborderons les quatre principaux types de données dans R:
Vecteurs: La structure de données la plus basique de R.
Listes: Collections polyvalentes pouvant contenir des éléments de différents types.
Les cadres de données : Les structures de données tabulaires, similaires aux feuilles de calcul ou aux tables SQL.
**Les matrices sont des tableaux bidimensionnels qui contiennent des éléments d’un seul type de données.
La compréhension de ces structures de données est essentielle pour écrire un code R efficace et effectuer des analyses de données efficaces.
Vecteurs
Les vecteurs sont le type de structure de données le plus simple de R. Il s’agit de collections ordonnées et homogènes d’éléments (tous les éléments doivent être du même type).
Création et utilisation de vecteurs
# Création d'un tableau numériquenum_vector <-c(1, 2, 3, 4, 5)print(num_vector)
[1] 1 2 3 4 5
# Création d'un vecteur de caractèreschar_vector <-c("apple", "banana", "cherry")print(char_vector)
[1] "apple" "banana" "cherry"
# Opérations de base sur les vecteurssum_vector <-sum(num_vector)print(paste("Sum:", sum_vector))
[1] "Sum: 15"
Quand utiliser les vecteurs
Utilisez les vecteurs pour stocker des séquences de nombres, de caractères ou de valeurs logiques lorsque tous les éléments sont du même type.
Listes
Les listes en R sont des structures de données flexibles qui peuvent contenir des éléments de différents types, y compris d’autres listes.
Création et utilisation de listes
# Création d'une liste contenant différents types de donnéesmy_list <-list(name ="Alice",age =25,scores =c(85, 90, 95))print(my_list)
# Accès aux éléments d'une listeprint(my_list$name)
[1] "Alice"
print(my_list[[3]])
[1] 85 90 95
Quand utiliser les listes
Utilisez des listes lorsque vous devez stocker des données hétérogènes ou une collection d’objets qui ne partagent pas nécessairement le même type.
Data frame
Les cadres de données sont des structures de données bidimensionnelles idéales pour traiter les données tabulaires. Elles sont similaires aux feuilles de calcul et vous permettent de stocker différents types de données dans chaque colonne.
Création et utilisation de cadres de données
# Création d'une matrice de donnéesstudents <-data.frame(name =c("Alice", "Bob", "Charlie"),age =c(25, 30, 35),major =c("Biology", "Mathematics", "Computer Science"))print(students)
name age major
1 Alice 25 Biology
2 Bob 30 Mathematics
3 Charlie 35 Computer Science
# Accès aux colonnes d'une trame de donnéesprint(students$name)
[1] "Alice" "Bob" "Charlie"
Quand utiliser les cadres de données
Les cadres de données sont mieux utilisés lorsque l’on travaille avec des données structurées et tabulaires. Ils sont particulièrement utiles en science des données pour des tâches telles que le nettoyage, la transformation et la visualisation des données.
Matrices
Les matrices sont des tableaux à deux dimensions qui contiennent des éléments d’un seul type de données. Ils sont principalement utilisés pour les calculs mathématiques.
Création et utilisation de matrices
# Création d'une matrice à partir d'un vecteur, en spécifiant le nombre de lignesmatrix_data <-matrix(1:9, nrow =3, byrow =TRUE)print(matrix_data)
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
# Opérations de base sur les matricesmatrix_sum <-sum(matrix_data)print(paste("Matrix Sum:", matrix_sum))
[1] "Matrix Sum: 45"
Quand utiliser les matrices
Utilisez les matrices pour les calculs numériques nécessitant une structure bidimensionnelle fixe, comme dans les opérations d’algèbre linéaire.
Conclusion
La compréhension des structures de données fondamentales de R - vecteurs, listes, cadres de données et matrices - est cruciale pour une analyse efficace des données. Chaque structure a ses propres cas d’utilisation, et les maîtriser vous aidera à écrire un code R plus efficace et plus lisible. Expérimentez avec ces exemples et explorez comment chaque structure de données peut être exploitée dans vos propres projets.
@online{kassambara2024,
author = {Kassambara, Alboukadel},
title = {Types de données et structures en R},
date = {2024-02-10},
url = {https://www.datanovia.com/fr/learn/programming/r/basics/data-types-and-structures.html},
langid = {fr}
}