Les 3v du big data : Volume, Vélocité et Variété des données

December 10, 2019

L’analyse de données Big Data est un concept difficile à saisir, il est décomposé en 3 segments simples (Les 3v du big data): variété, vitesse et volume.

Le big data , les mégadonnées ou les données massives, désigne des ensembles de données qui deviennent si volumineux qu’ils excèdent l’intuition et les capacités humaines d’analyse et même celles des outils informatiques classiques de gestion de base de données ou de l’information.

Pour mieux l’appréhender, on le scinde en 3 segments dits les 3v du big data.

Contenu

  1. [Le big data – 60 secondes pour comprendre]
  2. [Les nouvelles sources de données (Les 3v du big data)]
  3. [Volume]
  4. [Vélocité]
  5. [Variété]

Le big data – 60 secondes pour comprendre

Les nouvelles sources de données (Les 3v du big data)

Il constitue l’extension rapide des données non structurées, semi-structurées et structurées générées à partir **de périphériques connectés à Internet, des réseaux sociaux, des entreprises, des plateformes en ligne, applications mobiles, de la géolocalisation, des données de connexion, open data etc…

Big data nouvelles sources de données

Ces données sont analysées par des spécialistes d’analyse de données. Les informations issuent de l’analyse(en anglais insights ) aideront les entreprises dans les prises de décisions stratégiques: ( Cibler les campagnes marketing, faire des prédictions sur les futures ventes, visualiser l’évolution des business, mieux comprendre les clients etc…).

L‘analyse Big data est un concept difficile à saisir, en particulier avec la diversité et la quantité de données disponibles aujourd’hui.

Pour donner du sens à ce concept, les experts l’ont décomposé en 3 éléments simples. Ces trois éléments sont appelés les 3v de la donnée : variété, vitesse et volume. On parlera dans d’autres ouvrages des 5Vs ou même des 7Vs du Big Data.

Les 3v du big data

Les acteurs du big data s’accordent généralement sur un petit ensemble de critères à respecter qui, tous ensemble, constituent des «big data». Ceux-ci sont communément appelés les 3V du Big Data.

  • Volume: Quantité totale de données stockées.
  • Velocité: A quelle fréquence de nouvelles données sont créées et doivent être stockées .
  • Variété: L’hétérogénéité des structures de données.

Volume

Le volume décrit la quantité de données générées par des entreprises, les objets connectées, ou des personnes. Selon planetoscope, chaque seconde, 29.000 Gigaoctets (Go) d’informations sont publiés dans le monde, soit 2,5 exaoctets par jour soit 912,5 exaoctets par an. Un volume de “big data” qui croît à une vitesse extraordinaire.

Les 3v du big data évolution des données

Prenons pour exemple les médias sociaux, car ils ont un impact considérable sur l’explosion des données. Depuis 2016, plus de 2 000 milliards de publications et 250 milliards de photos ont été téléchargés.

Facebook regorge de données personnelles et ses 2,2 milliards d’utilisateurs partageant des données à chaque seconde. La gestion de cette quantité de données serait impossible sans le développement du Big Data.

Vélocité

La vitesse décrit la fréquence à laquelle les données sont générées, capturées ou partagées. Du fait des évolutions technologiques, les consommateurs et les entreprises génèrent plus de données dans des temps beaucoup plus courts.

Une étude menée par Digital Universe révèle que la taille des données dans le monde entier double tous les deux ans. Le plus important, c’est que 3% des données sont organisées et que seulement 0,5% sont prêtes à être analysées. Les données “big data” ne sont pas simplement volumineuses; ça évolue vite.

Les 3v du big data velocité des données

A titre d’exemple, les statistiques quotidiennes de Facebook. Selon les informations de Social Skinny, 293 000 status sont mis à jour, 136 000 photos téléchargées et 500 000 commentaires postés sur Facebook chaque minute.

Alors, la technologie des métadonnées et la technologie Big Data associées à l’apprentissage automatique (Machine Learning) et à l’intelligence artificielle sont utilisées pour donner un instantané dans les différents cas d’utilisation.

Variété

Les données sont rapides, les données sont volumineuses, mais les données sont extrêmement diverses. L’expansion de types de données provenant de sources comme les médias sociaux, les interactions Machine to Machine et les terminaux mobiles, crée une très grande diversité.

Auparavant, les données se trouvaient dans une base de données structurée(SQL), dans un simple fichier texte ou dans une feuille de calcul. Il n’y avait pas beaucoup d’options sur la façon d’utiliser les données.

types de données

De toute évidence, le Big Data a changé la perspective sur les données. Bien qu’il reste encore de la place pour les données textuelles, il existe d’autres formes de présentation de données.

Par exemple, video, audio, géospatial, images, données de connexion, données générées par des machines et objets connectées, données mobiles, données RFID et bien d’autres entrent en jeu.

Chaque formulaire de données possède son propre type d’unicité quant à la manière dont il est classé et stocké dans un système d’information. Ce qui rend le format unique. C’est de cette manière qu’il est possible de les analyser pour créer des solutions valables.

Conclusion:

Grâce aux services et outils d’analyse de données volumineuses, les entreprises trouveront plus facile de présenter des informations, de faire des prédictions et de créer des solutions innovantes. Ainsi, les métiers de l’analyse de données volumineuses sont de plus en plus demandée aujourd’hui.