Introduction aux concepts du Big Data
Ce sujet principal est une introduction à un certain nombre de concepts pertinents pour toutes les solutions regroupées sous le terme “big data”. Il fournit, grâce à ces concepts, des outils pour comprendre une telle solution et voir les différences entre elles.
À partir de ce point, vous pouvez vous concentrer sur un certain nombre de solutions courantes. Il est important de noter que ce module met l’accent sur le modèle en couches de stockage – souvent à plusieurs reprises –, de traitement et de processing. Le module ne se concentre pas tant sur les applications elles-mêmes, mais plutôt sur les fondamentaux du stockage et du traitement des données (non) structurées.
Objectifs d’apprentissage
À la fin de ce sujet principal, vous serez capable de :
- Nommer et donner des exemples des compromis des différents types de concepts/implémentations de bases de données distribuées basés sur le théorème CAP.
- Caractériser et donner des exemples des architectures big data pour le traitement par lots, en streaming et basé sur la virtualisation.
Vous serez capable de :
- Faire la distinction entre les données structurées, semi-structurées et non structurées.
- Expliquer les concepts de scaling in et scaling out et ce que cela signifie pour le développement du big data.
- Nommer et donner un exemple des compromis des différents types de concepts/implémentations de bases de données distribuées basés sur le théorème CAP.
- Expliquer le concept des 3V’s, aujourd’hui aussi des 5V’s.
- Caractériser les architectures big data pour le traitement par lots, en streaming et basé sur la virtualisation, et en donner un exemple.