The Doppler Quarterly (FRANÇAIS) Été 2016 | Page 45
Lac de données hébergé
par AWS
Consommateurs de données
Analyses prédictives
AWS Machine Learning
Traitement des données
du lac de données
Tableaux de bord
Stockage & récupération des
données du lac de données
Métadonnées
Politiques de
gouvernance
Science des données
Moteur ETL
Moteur Règles/
Correspondance
E-commerce
Spark
Quicksight
Applications mobiles
Intégration des données
S3
Glacier
Figure 7 : Architecture de lac de données hébergée par AWS
Les principales technologies et fonctionnalités du lac de données AWS incluent :
Aspects opérationnels
• CloudFormations – AWS fournit CloudFormations, une méthode automa-
tique pour mobiliser les services et les configurations de manière
renouvelable.
Évolutivité et performances
• IDM – AWS fournit de puissantes capacités de gestion des identités et
des accès sur l'ensemble de son portefeuille cloud, ainsi que la capacité
d'intégrer avec les infrastructures existantes de LDAP ou Active Direc-
tory. Cette capacité garantit des droits cohérents sur l'ensemble des
méthodes d'accès aux données.
Accès aux données et récupération
• S3 – S3 est la plate-forme de magasin d'objets pour AWS. Elle fournit une
API simple pour le stockage et la récupération des données.
• Redshift – Redshift est la plate-forme de l'entrepôt de données d'entre-
prise AWS. Elle fournit un accès analytique haute vitesse aux grands
ensembles de données complexes. Redshift est une fonctionnalité PaaS,
garantissant un faible coût d'exploitation.
• EMR – Elastic MapReduce est une implémentation AWS de MapReduce,
permettant un traitement par lots hautement évolutif des données qui
est envoyé aux autres systèmes pour les requêtes et les analyses.
• DynamoDB – DynamoDB est une plate-forme NoSQL à faible latence
intégralement gérée qui permet aux développeurs de créer des applica-
tions puissantes et réactives qui possèdent un niveau élevé d'intégrité
des données les supportant.
ÉTÉ 2016 | THE DOPPLER | 43