Orientation du module
Introduction au Big Data Concepts fondamentaux du (big) data.
Évolutions de la science des données dans la pratique, composition d'équipe et mise en œuvre.
Conflit des données (massives) contre les préoccupations d'éthiques, la vie privée et la sécurité
Gestion des données, qualité et gouvernance au sein d'une organisation
L'utilisation des données au sein de l'organisation
Accéder, visualiser et analyser les données
Développements technologiques pour l'avenir
Préparation à l'examen

Etude 3

Dans la réalité, la distinction entre ce qui constitue réellement la ‘big’ data suscite souvent une certaine confusion. Gartner, un institut de recherche de renom, a énoncé au début de ce siècle certaines caractéristiques que les données doivent posséder pour être qualifiées de ‘big’. Gartner a identifié trois V associés étroitement à la big data : Volume, Vélocité et Variété.

Avec la croissance constante du volume de données, le paysage informatique et l’architecture informatique évoluent également. On peut concevoir le paysage et l’architecture comme une représentation schématique de l’informatique, illustrant les applications utilisées, les connexions entre celles-ci, ainsi que les techniques déployées. En raison de ces quantités massives de données, les systèmes existants ne peuvent pas toujours répondre adéquatement, conduisant ainsi à de nouvelles évolutions.

L’informatique en nuage (cloud computing) et le logiciel libre (open source) sont parmi les tendances et les techniques qui se développent largement. L’informatique en nuage suppose que tous les traitements des systèmes et le stockage des données ne se déroulent plus physiquement dans l’environnement interne, mais plutôt à l’extérieur. Des entreprises comme Amazon se consacrent entièrement à cette approche. Le logiciel libre est une catégorie de logiciels généralement accessible gratuitement, sans frais d’acquisition, et dont le code source (la structure du système) est public. Ces systèmes permettent aux entreprises de développer des projets liés aux données de manière plus rapide et plus aisée.

Reconnaissez-vous peut-être ces développements au sein de votre propre organisation ? Savez-vous quels services au sein de votre organisation sont toujours gérés en interne et lesquels ont été externalisés vers des services cloud, par exemple ? Il est possible qu’il y en ait un grand nombre. Dans le même temps, il est judicieux pour une organisation de déterminer quelles données elle préfère conserver en interne et celles qui peuvent être externalisées, notamment en matière de sécurité.

Prenez le temps d’étudier maintenant le chapitre 5 du module.

Scroll to Top