The Doppler Quarterly (FRANÇAIS) L'automne 2017 | Page 21
Les catalogues de données,
une cheville ouvrière pour votre
stratégie de données dans le cloud
Joey Jablonski et Neal Matthews
Les organisations centrées sur les données
dont les opérations sont effi caces s’appui-
ent sur des catalogues de données pour
offrir une visibilité totale sur les données
disponibles dans un lieu à la fois aisément
consommable et géré de façon
centralisée.
Les lacs de données sont devenus un enjeu incontourn-
able pour les environnements de données de nom-
breuses organisations. Si ces lacs de données renfer-
ment sans contexte des fonctionnalités inédites, bon
nombre d’entreprises n’en ont pas moins de mal à en
retirer la quintessence, compte tenu de la surcharge
opérationnelle occasionnée par la gestion d’une multi-
tude d’interfaces, d’outils, d’ensembles de données et de
points d’intégration peu familiers. Dans bien des cas, ces
lacs se transforment en « marécages » en raison de la
quantité massive de données qui y sont ingérées, alors
qu’aucune méthode claire n’existe pour rechercher des
ensembles de données, les distinguer suivant les besoins
et identifi er les éléments fondamentaux valorisables du
point de vue de l’activité.
La valeur des catalogues de données
En quoi le déploiement de la fonctionnalité de catalogue
de données est-il important ? La raison est que même si
de nombreuses organisations comprennent dès aujo-
urd’hui l’intérêt qu’il y a à centraliser les données de leur
entreprise, elles n’en sont encore qu’au stade où elles
découvrent la diffi culté d’accéder à ces données effi ca-
cement et en toute sécurité. L’origine de cette complex-
ité est liée au fait que les données sont ingérées depuis
de nombreux lieux différents, avec des quantités de
structure variables.
Les catalogues de données sont un élément indispens-
able de tous les déploiements de lac de données pour
assurer que les ensembles de données soient suivis,
identifi ables suivant les modalités de l’entreprise, gou-
vernés et gérés. Dan Woods, contributeur de Forbes,
met en garde les organisations contre la stratégie qui
consiste à utiliser des connaissances tribales, en raison
de son manque de capacités évolutives 1 . Les catalogues
de données cristallisent les politiques de gouvernance
de données internes à l’entreprise sous forme de pra-
tiques qui jouent à la fois le rôle de moteur d’exécution et
d’outil d’audit de conformité. Le caractère inclusif du
catalogue de données permet la collaboration et le part-
age centralisés des informations à un emplacement
connu, accessible depuis l’ensemble de l’organisation.
Les catalogues de données deviennent le point d’entrée
utilisé par les statisticiens et analystes de données de
tous bords par l’entremise des ingénieurs de données
(Figure 1), dont le rôle consiste notamment à générer des
ensembles de données enrichis à des fi ns analytiques.
Les catalogues de données assurent à ces équipes dis-
séminées de pouvoir collaborer sur la qualité de l’ensem-
ble de données, l’utilisation et les descriptions
commerciales.
AUTOMNE 2017 | THE DOPPLER | 19