Je souhaite obtenir des informations sur une formation complète concernant le thème DIVI dispensé
par un organisme de formation certifié par l’état.
Que la formation soit finançable par mon CPF (idéalement) ou autre


Structures de données

Les structures de données sont utilisées pour stocker les données de manière organisée afin de rendre la manipulation des données et d’autres opérations de données plus efficaces.
Il y a cinq types de structures de données dans la programmation R mentionnée ci-dessous:

  • vecteur
  • liste
  • matrice
  • Trame de données
  • facteur

Certification en Big Data Analytics

vecteur

Vector est l’une des structures de données de base de la programmation R. Il est intrinsèquement homogène, ce qui signifie qu’il ne contient que des éléments du même type de données. Les types de données peuvent être numériques, entiers, caractères, complexes ou logiques.
Le vecteur en programmation R est créé avec la fonction c (). Le forçage se produit dans un vecteur de bas en haut si les éléments transférés ont des types de données différents, de logique à entier à double à caractères.
La fonction typeof () est utilisée pour vérifier le type de données du vecteur et la fonction class () est utilisée pour vérifier la classe d’un vecteur.
Par exemple:

Vec1 <- c(44, 25, 64, 96, 30)
Vec2 <- c(1, FALSE, 9.8, "hello world")
typeof(Vec1)
typeof(Vec2)

Sortir:

[1] "double"
[1] "character"

Pour supprimer un vecteur, procédez comme suit

Vec1 <- NULL
Vec2 <- NULL

Accès aux éléments vectoriels

Les éléments d’un vecteur sont accessibles à l’aide de leurs indices respectifs.[ ] Les index des éléments auxquels accéder sont indiqués entre parenthèses.
Par exemple:

x <- c("Jan","Feb","March","Apr","May","June","July")
y <- x[c(3,2,7)]
print(y)
Output:
[1] "March" "Feb"   "July"

Nous pouvons également utiliser l’indexation logique, l’indexation négative et 0/1 pour accéder aux éléments d’un vecteur:
Par exemple:

x <- c("Jan","Feb","March","Apr","May","June","July")
y <- x[c(TRUE,FALSE,TRUE,FALSE,FALSE,TRUE,TRUE)]z <- x[c(-3,-7)]c <- x[c(0,0,0,1,0,0,1)]
print(y)
print(z)
print(c)

Sortir:

[1] "Jan"   "March" "June" "July"(All TRUE values are printed)
[1] "Jan" "Feb" "Apr" "May" "June"(All corresponding values for negative indexes are dropped)
[1] "Jan" "Jan"(All corresponding values are printed)

Arithmétique vectorielle

Nous pouvons faire des additions, des soustractions, des multiplications et des divisions pour des vecteurs avec le même nombre d’éléments de la manière suivante:

v1 <- c(4,6,7,31,45)
v2 <- c(54,1,10,86,14,57)
add.v <- v1+v2
print(add.v)
sub.v <- v1-v2
print(sub.v)
multi.v <- v1*v2
print(multi.v)
divi.v <- v1/v2
print(divi.v)

Sortir:

[1]  58   7  17 117  59  66
[1] -50   5  -3 -55  31 -48
[1]  216    6   70 2666  630  513
[1] 0.07407407 6.00000000 0.70000000 0.36046512 3.21428571 0.15789474

Recyclage des éléments vectoriels

Lorsque des opérations arithmétiques sont effectuées sur des vecteurs de longueurs inégales, les éléments du vecteur qui sont plus petits en nombre par rapport à l’autre vecteur sont recyclés. Par exemple:

v1 <- c(8,7,6,5,0,1)
v2 <- c(7,15)                               
add.v <- v1+v2                                     
(v2 becomes c(7,15,7,15,7,15))
print(add.v)
sub.v <- v1-v2
print(sub.v)

Sortir:

[1] 15 22 13 20  7 16
[1]   1  -8  -1 -10  -7 -14

Voulez-vous être certifié en R! Apprenez la programmation R auprès des meilleurs experts en programmation R et marquez votre carrière chez Intellipaat Science des données avec certification R!

Trier le vecteur

On peut trier les éléments d’un vecteur avec le Trier par() Fonctionne de la manière suivante.

v <- c(4,78,-45,6,89,678)
sort.v <- sort(v)
print(sort.v)
#Sort the elements in the reverse order
revsort.v <- sort(v, decreasing = TRUE)
print(revsort.v) 
#Sorting character vectors
v <- c("Jan","Feb","March","April")
sort.v <- sort(v)
print(sort.v) 
#Sorting character vectors in reverse order
revsort.v <- sort(v, decreasing = TRUE)
print(revsort.v)

Sortir:

[1] -45   4   6 78 89 678
[1] 678 89 78   6   4 -45
[1] "April" "Feb" "Jan"   "March"
[1] "March" "Jan"   "Feb"   "April"

Devenez architecte Big Data

Liste en programmation R

Une liste en programmation R est une structure de données non homogène, ce qui implique qu’elle peut contenir des éléments de différents types de données. Il accepte des nombres, des caractères, des listes et même des matrices et des fonctions en eux. Il est créé avec le Lister() Une fonction.
Par exemple:

list1<- list("Sam", "Green", c(8,2,67), TRUE, 51.99, 11.78,FALSE)
print(list1)

Sortir:

[[1]]
[1] "Sam"
[[2]]
[1] "Green"
[[3]]
[1]  8  2 67
[[4]]
[1] TRUE
[[5]]
[1] 51.99
[[6]]
[1] 11.78
[7]]
[1] FALSE

Accès aux éléments d’une liste

Les éléments d’une liste sont accessibles à l’aide des index de ces éléments.
Par exemple:

list2 <- list(matrix(c(3,9,5,1,-2,8), nrow = 2), c("Jan","Feb","Mar"), list(3,4,5))
print(list2[1])
print(list2[2])
print(list2[3])

Sortir:

[[1]]
[,1] [,2] [,3]          (First element of the list)
[1,]    3    5   -2
[2,]    9    1    8
[[1]]
[1] "Jan" "Feb" "Mar"        (Second element of the list)
[1,]    3    5   -2
[[1]]
[[1]][[1]]
[1] 3
[[1]][[2]]                      (Third element of the list)
[1] 4
[[1]][[3]]
[1] 5

Vous voulez des entrevues de programmation Crack R? Le meilleur Apache d’Intellipaat Questions d’entretien chez R ne sont destinés qu’à vous!

Ajouter, supprimer des éléments d’une liste

Nous ne pouvons ajouter et supprimer des éléments qu’à la fin d’une liste.
Par exemple:

list2 <- list(matrix(c(3,9,5,1,-2,8), nrow = 2), c("Jan","Feb","Mar"), list(3,4,5))
list2[4] <- “HELLO”
print(list2[4])

Sortir:

[[1]]
[1] "Hello"

Similaire,

list2[4] <- NULL
print(list2[4])

Sortir:

[[1]]
NULL

Mettre à jour les éléments d’une liste

Utilisez la syntaxe suivante pour mettre à jour une valeur dans une liste:

list2[3] <- "Element Updated"
print(list2[3])

Sortir:

[[1]]
[1] "Element Updated"

Matrice en programmation R

La matrice en programmation R est une structure de données bidimensionnelle de nature homogène, ce qui signifie que seuls les éléments du même type de données sont acceptés. Le forçage se produit lorsque des éléments de différents types de données sont transférés. Il est créé avec la fonction matrix ().
La syntaxe de base pour créer une matrice est donnée ci-dessous:
Matrice (données, nrow, ncol, byrow, dimnames)
Où,
data = l’élément d’entrée d’une matrice spécifiée comme vecteur.
nrow = le nombre de lignes à créer.
ncol = nombre de colonnes à créer.
byrow = la disposition ligne par ligne des éléments au lieu de la colonne par colonne
dimnames = les noms des colonnes / lignes à créer.
Par exemple:

M1 <- matrix(c(1:9), nrow = 3, ncol =3, byrow= TRUE)
print(M1)

Sortir:

[,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
M2 <-  matrix(c(1:9), nrow = 3, ncol =3, byrow= FALSE)
print(M2)

Sortir:

[,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9

En utilisant les noms de ligne et de colonne, une matrice peut être construite comme suit:

rownames = c("row1", "row2", "row3")
colnames = c("col1", "col2", "col3")
M3 <- matrix(c(1:9), nrow = 3, byrow = TRUE, dimnames = list(rownames, colnames))
print(M3)

Sortir:

col1 col2 col3
row1    1    2    3
row2    4    5    6
row3    7    8    9

avez vous d’autres questions? Venez chez nous Communauté de programmation R et laissez-les s’éclaircir aujourd’hui!

Accès aux éléments d’une matrice

Pour accéder aux éléments d’une matrice, les index de ligne et de colonne sont utilisés des manières suivantes:
Utilisez la syntaxe suivante pour accéder aux éléments de la matrice M3 créée ci-dessus:

print(M3[1,1])
print(M3[3,3])
print(M3[2,3])

Sortir:

[1] 1 (Element at first row and first column)
[1] 9 (Element at third row and third column)
[1] 6 (Element at second row and third column)

Trame de données

Une trame de données dans la programmation R est une structure de type tableau bidimensionnelle, également similaire à une table, dans laquelle chaque colonne contient les valeurs d’une variable et chaque ligne contient un ensemble de valeurs de chaque colonne.
Un bloc de données a les propriétés suivantes:

  • Les noms de colonne d’un bloc de données ne doivent pas être vides.
  • Les noms de ligne doivent être uniques.
  • Les données stockées dans un bloc de données peuvent être des données numériques, des facteurs ou des types de caractères.
  • Chaque colonne doit contenir le même nombre d’éléments de données.

En savoir plus sur la programmation R ici Formation en programmation R à Toronto pour avancer dans votre carrière!

Créer un bloc de données

Utilisez la syntaxe suivante pour créer une trame de données dans la programmation R:

empid <- c(1:4)
empname <- c("Sam","Rob","Max","John")
empdept <- c("Sales","Marketing","HR","R & D")
emp.data <- data.frame(empid,empname,empdept)
print(emp.data)

Sortir:

Sl. Non. empid empname empdept
1 1 Sam Ventes
2 2 Rob commercialisation
3 3 Max MONSIEUR
4e 4e John R&D

Extraire des colonnes / lignes d’un bloc de données

Utilisez la syntaxe suivante pour extraire une colonne spécifique d’un bloc de données:

result <- data.frame(emp.data$empname,emp.data$empdept)
print(result)

Sortir:

Sl. Non. emp.data.empname emp.data.empdept
1 Sam Ventes
2 Rob commercialisation
3 Max MONSIEUR
4e John R&D

Utilisez la syntaxe suivante pour extraire des lignes spécifiques d’un bloc de données:

result <- emp.data[1:2,]
print(result)

Sortir:

Sl. Non. empid empname empdept
1 1 Sam Ventes
2 2 Rob commercialisation

Le code suivant extrait les première et troisième lignes avec les deuxième et troisième colonnes, respectivement.

result <- emp.data[c(1,2),c(2,3)]
print(result)

Sortir:

Sl. Non. empname empdept
1 Sam Ventes
2 Max MONSIEUR

Ajouter une colonne à un bloc de données

Utilisez la syntaxe suivante pour ajouter une colonne de salaire au bloc de données ci-dessus:

emp.data$salary <- c(20000,30000,40000,27000)
n <- emp.data
print(n)
Sl. Non. empid empname empdept un salaire
1 1 Sam Ventes 20000
2 2 Rob commercialisation 30000
3 3 Max MONSIEUR 40000
4e 4e John R&D 27 000

Ajouter une ligne à un bloc de données

Pour ajouter de nouvelles lignes à un bloc de données existant, vous devez créer un nouveau bloc de données pour contenir les nouvelles lignes, puis utiliser la fonction rbind () pour le fusionner avec le bloc de données existant. C’est ainsi que nous obtenons la trame de données finale.

Créer un nouveau bloc de données

emp.newdata <-   data.frame(
empid = c(5:7),
empname = c("Frank","Tony","Eric"),
empdept = c("IT","Operations","Finance"),
salary = c(32000,51000,45000)
)

Apprenez de nouvelles technologies

Fusionner le bloc de données créé avec le bloc existant::

emp.finaldata <- rbind(emp.data,emp.newdata)
print(emp.finaldata)

Sortir:

Sl. Non. empid empname empdept un salaire
1 1 Sam Ventes 20000
2 2 Rob commercialisation 30000
3 3 Max MONSIEUR 40000
4e 4e John R&D 27 000
5 5 Franc CE 32 000
6e 6e Tony Opérations 51 000
7e 7e Eric Finances 45 000

Souhaitez-vous apprendre la programmation R avec des experts? Inscrivez-vous avec nous Instituts de formation en programmation R à Bangalore maintenant!

facteur

Les facteurs de programmation R sont utilisés dans l’analyse des données pour la modélisation statistique. Ils sont utilisés pour classer les valeurs uniques dans des colonnes telles que «Homme», «Femme», «VRAI», «FAUX», etc. et les stocker sous forme de niveaux. Vous pouvez stocker à la fois des chaînes et des entiers. Ils sont utiles dans les colonnes avec un nombre limité de valeurs uniques.
Des facteurs peuvent être créés avec le Facteur() Fonction et ils prennent des vecteurs comme entrées.
Par exemple:

data <- c("Male","Female","Male","Child","Child","Male","Female","Female")
print(data)
factor.data <- factor(data)
print(factor.data)

Sortir:

[1] Male   Female Male   Child  Child  Male   Female Female
Levels: Child Female Male

Pour chaque bloc de données, R traite la colonne de texte comme des données catégorielles et crée des facteurs dessus.
Exemple: Pour le bloc de données emp.finaldata, R empdept traite empdept comme un facteur.

print(is.factor(emp.finaldata$empdept))
print(emp.finaldata$empdept)

Sortir:

[1] TRUE
[1] Sales      Marketing  HR         R & D      IT         Operations Finance   
Levels: HR     Marketing     R & D     Sales    Finance     IT Operations

Dans ce tutoriel, nous avons appris quelles sont les structures de données dans la programmation R, quels sont leurs différents types et comment les manipulations de données simples sont effectuées à l’aide de structures de données. Nous en parlerons lors de la prochaine session Instructions de contrôle du flux dans R.. Rencontrons-nous là-bas!



Source link

Recent Posts