Types de données et structures en R

Couvrir les vecteurs, les listes, les cadres de données et les matrices

Apprenez à travailler avec les principales structures de données de R : vecteurs, listes, cadres de données et matrices. Ce tutoriel explique les propriétés et les cas d’utilisation de chaque type de données et fournit des exemples de code pratiques.

Programmation
Auteur·rice
Affiliation
Date de publication

10 février 2024

Modifié

9 mai 2025

Mots clés

Types de données R, Structures de données R, Vecteurs R, Listes R, Trames de données R, R matrices

Introduction

R offre un riche ensemble de structures de données qui constituent les éléments de base de l’analyse des données. Dans ce tutoriel, nous aborderons les quatre principaux types de données dans R:

  • Vecteurs: La structure de données la plus basique de R.
  • Listes: Collections polyvalentes pouvant contenir des éléments de différents types.
  • Les cadres de données : Les structures de données tabulaires, similaires aux feuilles de calcul ou aux tables SQL.
  • **Les matrices sont des tableaux bidimensionnels qui contiennent des éléments d’un seul type de données.

La compréhension de ces structures de données est essentielle pour écrire un code R efficace et effectuer des analyses de données efficaces.



Vecteurs

Les vecteurs sont le type de structure de données le plus simple de R. Il s’agit de collections ordonnées et homogènes d’éléments (tous les éléments doivent être du même type).

Création et utilisation de vecteurs

# Création d'un tableau numérique
num_vector <- c(1, 2, 3, 4, 5)
print(num_vector)                         
[1] 1 2 3 4 5
# Création d'un vecteur de caractères
char_vector <- c("apple", "banana", "cherry")
print(char_vector)                       
[1] "apple"  "banana" "cherry"
# Opérations de base sur les vecteurs
sum_vector <- sum(num_vector)
print(paste("Sum:", sum_vector))        
[1] "Sum: 15"

Quand utiliser les vecteurs

Utilisez les vecteurs pour stocker des séquences de nombres, de caractères ou de valeurs logiques lorsque tous les éléments sont du même type.

Listes

Les listes en R sont des structures de données flexibles qui peuvent contenir des éléments de différents types, y compris d’autres listes.

Création et utilisation de listes

# Création d'une liste contenant différents types de données
my_list <- list(
  name = "Alice",
  age = 25,
  scores = c(85, 90, 95)
)
print(my_list)
$name
[1] "Alice"

$age
[1] 25

$scores
[1] 85 90 95
# Accès aux éléments d'une liste
print(my_list$name)
[1] "Alice"
print(my_list[[3]])
[1] 85 90 95

Quand utiliser les listes

Utilisez des listes lorsque vous devez stocker des données hétérogènes ou une collection d’objets qui ne partagent pas nécessairement le même type.

Data frame

Les cadres de données sont des structures de données bidimensionnelles idéales pour traiter les données tabulaires. Elles sont similaires aux feuilles de calcul et vous permettent de stocker différents types de données dans chaque colonne.

Création et utilisation de cadres de données

# Création d'une matrice de données
students <- data.frame(
  name = c("Alice", "Bob", "Charlie"),
  age = c(25, 30, 35),
  major = c("Biology", "Mathematics", "Computer Science")
)
print(students)
     name age            major
1   Alice  25          Biology
2     Bob  30      Mathematics
3 Charlie  35 Computer Science
# Accès aux colonnes d'une trame de données
print(students$name)
[1] "Alice"   "Bob"     "Charlie"

Quand utiliser les cadres de données

Les cadres de données sont mieux utilisés lorsque l’on travaille avec des données structurées et tabulaires. Ils sont particulièrement utiles en science des données pour des tâches telles que le nettoyage, la transformation et la visualisation des données.

Matrices

Les matrices sont des tableaux à deux dimensions qui contiennent des éléments d’un seul type de données. Ils sont principalement utilisés pour les calculs mathématiques.

Création et utilisation de matrices

# Création d'une matrice à partir d'un vecteur, en spécifiant le nombre de lignes
matrix_data <- matrix(1:9, nrow = 3, byrow = TRUE)
print(matrix_data)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
# Opérations de base sur les matrices
matrix_sum <- sum(matrix_data)
print(paste("Matrix Sum:", matrix_sum))
[1] "Matrix Sum: 45"

Quand utiliser les matrices

Utilisez les matrices pour les calculs numériques nécessitant une structure bidimensionnelle fixe, comme dans les opérations d’algèbre linéaire.

Conclusion

La compréhension des structures de données fondamentales de R - vecteurs, listes, cadres de données et matrices - est cruciale pour une analyse efficace des données. Chaque structure a ses propres cas d’utilisation, et les maîtriser vous aidera à écrire un code R plus efficace et plus lisible. Expérimentez avec ces exemples et explorez comment chaque structure de données peut être exploitée dans vos propres projets.

Plus d’informations

Bon codage et bonne exploration des puissantes structures de données de R!

Articles connexes

Explorer d’autres articles

Note

Voici d’autres articles de la même catégorie pour vous aider à approfondir le sujet.

placeholder

placeholder
Aucun article correspondant
Retour au sommet

Réutilisation

Citation

BibTeX
@online{kassambara2024,
  author = {Kassambara, Alboukadel},
  title = {Types de données et structures en R},
  date = {2024-02-10},
  url = {https://www.datanovia.com/fr/learn/programming/r/basics/data-types-and-structures.html},
  langid = {fr}
}
Veuillez citer ce travail comme suit :
Kassambara, Alboukadel. 2024. “Types de données et structures en R.” February 10, 2024. https://www.datanovia.com/fr/learn/programming/r/basics/data-types-and-structures.html.