The Doppler Quarterly (FRANÇAIS) Été 2016 | Page 42

Créer un lac de données est une intégration de technologies complexes qui fonctionnent ensemble pour fournir un accès aux différents ensembles de don- nées. Voici les principaux domaines fonctionnels qui doivent être inclus dans tous les déploiements de lacs de données : Traitement de données – La capacité du lac de données à se connecter en toute fluidité aux autres systèmes, fournir des mappages épurés pour les don- nées et déplacer les données de manière automatique et fiable. • Streaming – Capacité d'analyse et de prise de décisions pour les données à la volée. • Règles/Correspondance – Capacité à exécuter une correspondance de modèle par rapport aux données des opérations telles que la déperson- nabilisation ou la déduplication. • ETL – Un moteur d'extraction-transformation-chargement est essentiel à l'intégration sur les plate-formes existantes RDBMS et EDW. • Gouvernance – Toute gouvernance doit être implémentée de manière cohérente à la périphérie du lac de données afin de garantir la confor- mité et l'adhérence aux politiques d'entreprise. Stockage et récupération des données – Il s'agit des domaines fonction- nels permettant aux développeurs de demander des données aux formats standard, grâce aux API standard du lac de données. • Lots – Traitement à haut débit, haute latence pour les données qui sont analysées, non utilisé communément pour les charges de travail interactives. • Analytique – Utilisé couramment pour les charges de travail interactives où les requêtes changent au fil du temps. • En mémoire – Permet de prendre en charge les requêtes à très faible latence qui prennent en charge l'usage interactif ou autres besoins de faible latence. • Rechercher/Indexer – Offrent la capacité de localiser rapidement les informations et les relations. • OLTP – Ciblé pour prendre en charge les systèmes transactionnels appa- raissant communément au sein des divisions et dans les équipes opérationnelles. Stockage – Il existe deux types principaux. • Objet – Un magasin d'objets est un composant essentiel d'un lac de don- nées pour le stockage des données non relationnelles, ainsi que les copies historiques d'informations pour les analyses ultérieures. • Long terme – Stockage à long terme, communément un composant du magasin d'objets, nécessaire pour l'archivage des données qui peuvent ne pas être utilisées régulièrement, mais qui nécessitent quand même de rester accessibles. Couramment utilisé pour les politiques de conformité et les règles de conservation légale. 40 | THE DOPPLER | ÉTÉ 2016