The Doppler Quarterly (FRANÇAIS) Été 2016 | Page 45

Lac de données hébergé par AWS Consommateurs de données Analyses prédictives AWS Machine Learning Traitement des données du lac de données Tableaux de bord Stockage & récupération des données du lac de données Métadonnées Politiques de gouvernance Science des données Moteur ETL Moteur Règles/ Correspondance E-commerce Spark Quicksight Applications mobiles Intégration des données S3 Glacier Figure 7 : Architecture de lac de données hébergée par AWS Les principales technologies et fonctionnalités du lac de données AWS incluent : Aspects opérationnels • CloudFormations – AWS fournit CloudFormations, une méthode automa- tique pour mobiliser les services et les configurations de manière renouvelable. Évolutivité et performances • IDM – AWS fournit de puissantes capacités de gestion des identités et des accès sur l'ensemble de son portefeuille cloud, ainsi que la capacité d'intégrer avec les infrastructures existantes de LDAP ou Active Direc- tory. Cette capacité garantit des droits cohérents sur l'ensemble des méthodes d'accès aux données. Accès aux données et récupération • S3 – S3 est la plate-forme de magasin d'objets pour AWS. Elle fournit une API simple pour le stockage et la récupération des données. • Redshift – Redshift est la plate-forme de l'entrepôt de données d'entre- prise AWS. Elle fournit un accès analytique haute vitesse aux grands ensembles de données complexes. Redshift est une fonctionnalité PaaS, garantissant un faible coût d'exploitation. • EMR – Elastic MapReduce est une implémentation AWS de MapReduce, permettant un traitement par lots hautement évolutif des données qui est envoyé aux autres systèmes pour les requêtes et les analyses. • DynamoDB – DynamoDB est une plate-forme NoSQL à faible latence intégralement gérée qui permet aux développeurs de créer des applica- tions puissantes et réactives qui possèdent un niveau élevé d'intégrité des données les supportant. ÉTÉ 2016 | THE DOPPLER | 43