The Doppler Quarterly (FRANÇAIS) Été 2016 | Page 39

Niveau de maturité Big Data
Personnel Maturité des processus
Niveau 1 - Accès aux données • Informatique basique / compétences informatiques
• Par mémoire
Niveau 2 - Consolidation • ETL , DBA • Par expérience Niveau 3 - Rapports
• Qualité des données
• Statistiques
• Développement
Niveau 4 - Alertes • Statistiques avancées • Automatisés Niveau 5 - Dialogue
• NLP , prévisibilité , modélisation , mathématiques , apprentissage automatique
Figure 2 : Maturité Big Data
La Figure 2 souligne l ' augmentation de la maturité de l ' adoption de Big data au sein d ' une organisation . A mesure que les entreprises gagnent en maturité , chaque niveau comporte de nouvelles composantes sur les technologies , le personnel et les processus . Le lac de données est communément déployé afin de prendre en charge le mouvement du Niveau 3 , au Niveau 4 et jusqu ' au Niveau 5 . Le lac de données offre une plate-forme d ' exécution des technologies avancées et un endroit permettant aux employés de mûrir leurs ensembles de compétences dans le domaine de l ' analyse des données et de la science des données .
Les avantages d ' un lac de données
• Documentés et reproductibles
• Apprentissage et évolution
Le principal avantage d ' un lac de données est de permettre la flexibilité grâce à une plate-forme évolutive d ' analyse des ensembles de données complexes . De nombreuses technologies différentes serviront pour cette analyse , notamment les outils d ' analyse prédictive , la modélisation des données , la qualité des données et l ' apprentissage automatique . La première partie de tout workflow analytique est le processus de données . La Figure 3 montre les étapes communément suivies pour ingérer , regrouper , indexer et finalement analyser les données d ' un lac de données . Ces étapes sont essentielles pour s ' assurer que des données de qualité supérieure sont regroupées , correctement associées et organisées afin de permettre aux scientifiques de données d ' analyser les données préparées .
Ingérer
Récupérer des données de sources et de partenaires multiples
Regrouper Découvrir des motifs et des liens
Indexer
Organiser les données pour un accès et une localisation à haute vitesse
Analyser
Identifier & analyser les relations
Figure 3 : Approche analytique de l ' analyse de données
ÉTÉ 2016 | THE DOPPLER | 37