The Doppler Quarterly (FRANÇAIS) Été 2016 | Page 42
Créer un lac de données est une intégration de technologies complexes qui
fonctionnent ensemble pour fournir un accès aux différents ensembles de don-
nées. Voici les principaux domaines fonctionnels qui doivent être inclus dans
tous les déploiements de lacs de données :
Traitement de données – La capacité du lac de données à se connecter en
toute fluidité aux autres systèmes, fournir des mappages épurés pour les don-
nées et déplacer les données de manière automatique et fiable.
• Streaming – Capacité d'analyse et de prise de décisions pour les données
à la volée.
• Règles/Correspondance – Capacité à exécuter une correspondance de
modèle par rapport aux données des opérations telles que la déperson-
nabilisation ou la déduplication.
• ETL – Un moteur d'extraction-transformation-chargement est essentiel
à l'intégration sur les plate-formes existantes RDBMS et EDW.
• Gouvernance – Toute gouvernance doit être implémentée de manière
cohérente à la périphérie du lac de données afin de garantir la confor-
mité et l'adhérence aux politiques d'entreprise.
Stockage et récupération des données – Il s'agit des domaines fonction-
nels permettant aux développeurs de demander des données aux formats
standard, grâce aux API standard du lac de données.
• Lots – Traitement à haut débit, haute latence pour les données qui sont
analysées, non utilisé communément pour les charges de travail
interactives.
• Analytique – Utilisé couramment pour les charges de travail interactives
où les requêtes changent au fil du temps.
• En mémoire – Permet de prendre en charge les requêtes à très faible
latence qui prennent en charge l'usage interactif ou autres besoins de
faible latence.
• Rechercher/Indexer – Offrent la capacité de localiser rapidement les
informations et les relations.
• OLTP – Ciblé pour prendre en charge les systèmes transactionnels appa-
raissant communément au sein des divisions et dans les équipes
opérationnelles.
Stockage – Il existe deux types principaux.
• Objet – Un magasin d'objets est un composant essentiel d'un lac de don-
nées pour le stockage des données non relationnelles, ainsi que les
copies historiques d'informations pour les analyses ultérieures.
• Long terme – Stockage à long terme, communément un composant du
magasin d'objets, nécessaire pour l'archivage des données qui peuvent ne
pas être utilisées régulièrement, mais qui nécessitent quand même de
rester accessibles. Couramment utilisé pour les politiques de conformité
et les règles de conservation légale.
40 | THE DOPPLER | ÉTÉ 2016