The Doppler Quarterly (FRANÇAIS) Été 2016 | Page 36

Créer une plate-forme pour l ' apprentissage automatique et les analyses

Joey Jablonski
Introduction
Les analyses prédictives et les technologies associées comme l ' apprentissage automatique requièrent un accès aux différents ensembles de données et aux puissantes ressources de calcul évolutives . Les capacités modernes , y compris les analyses prédictives et l ' apprentissage automatique , permettent aux organisations d ' optimiser les immenses volumes de données des réseaux sociaux , des parcours en ligne , de l ’ Internet des objets ( IoT ) et d ’ autres sources afin de prendre des décisions basées sur les données au sein d ' une organisation . S ' appuyer sur un « lac de données » pour stocker les informations nécessaires à l ' optimisation des analyses prédictives et aux charges de travail d ' apprentissage automatique donne au personnel d ' une organisation les moyens d ' analyser les données , tester les théories et mener les changements des processus métier , l ' expérience de la clientèle et les produits .
Un lac de données n ' a pas pour objet de remplacer les systèmes existants . Au contraire , il s ' agit d ' un point d ' intégration entre les plates-formes de données existantes , offrant une vue homogène de l ' ensemble des données d ' une organisation . Un lac de données complètera les systèmes existants en s ' assurant que les charges de travail d ' analyse , développement , test et création de modèle d ' apprentissage automatique n ' impacteront pas les charges de travail de production dans les autres systèmes aux performances optimisées . Pour finir , un lac de données est un concept , et même s ' il dispose de certaines technologies et workflows spécifiques , ses avantages reposent sur la connectivité entre le cœur du lac de données et les systèmes opérationnels et commerciaux pris en charge .
La création d ' un lac de données requiert des organisations qu ' elles évaluent la stratégie de données , l ' architecture d ' infrastructure et les workflows . Cela leur permet de s ' assurer que les données disponibles sont de grande qualité , liées à des analyses rapides et n ' exposent pas l ' organisation à des risques par la mise en danger des données ou la création de problèmes de conformité . La Figure 1 montre les mesures courantes prises par une organisation au lancement d ' un projet de lac de données , et les principales considérations , techniques et organisationnelles , qui doivent être traitées pour réussir une implémentation du lac de données .
34 | THE DOPPLER | ÉTÉ 2016