The Doppler Quarterly (FRANÇAIS) L'automne 2017 | Page 21

Les catalogues de données, une cheville ouvrière pour votre stratégie de données dans le cloud Joey Jablonski et Neal Matthews Les organisations centrées sur les données dont les opérations sont effi caces s’appui- ent sur des catalogues de données pour offrir une visibilité totale sur les données disponibles dans un lieu à la fois aisément consommable et géré de façon centralisée. Les lacs de données sont devenus un enjeu incontourn- able pour les environnements de données de nom- breuses organisations. Si ces lacs de données renfer- ment sans contexte des fonctionnalités inédites, bon nombre d’entreprises n’en ont pas moins de mal à en retirer la quintessence, compte tenu de la surcharge opérationnelle occasionnée par la gestion d’une multi- tude d’interfaces, d’outils, d’ensembles de données et de points d’intégration peu familiers. Dans bien des cas, ces lacs se transforment en « marécages » en raison de la quantité massive de données qui y sont ingérées, alors qu’aucune méthode claire n’existe pour rechercher des ensembles de données, les distinguer suivant les besoins et identifi er les éléments fondamentaux valorisables du point de vue de l’activité. La valeur des catalogues de données En quoi le déploiement de la fonctionnalité de catalogue de données est-il important ? La raison est que même si de nombreuses organisations comprennent dès aujo- urd’hui l’intérêt qu’il y a à centraliser les données de leur entreprise, elles n’en sont encore qu’au stade où elles découvrent la diffi culté d’accéder à ces données effi ca- cement et en toute sécurité. L’origine de cette complex- ité est liée au fait que les données sont ingérées depuis de nombreux lieux différents, avec des quantités de structure variables. Les catalogues de données sont un élément indispens- able de tous les déploiements de lac de données pour assurer que les ensembles de données soient suivis, identifi ables suivant les modalités de l’entreprise, gou- vernés et gérés. Dan Woods, contributeur de Forbes, met en garde les organisations contre la stratégie qui consiste à utiliser des connaissances tribales, en raison de son manque de capacités évolutives 1 . Les catalogues de données cristallisent les politiques de gouvernance de données internes à l’entreprise sous forme de pra- tiques qui jouent à la fois le rôle de moteur d’exécution et d’outil d’audit de conformité. Le caractère inclusif du catalogue de données permet la collaboration et le part- age centralisés des informations à un emplacement connu, accessible depuis l’ensemble de l’organisation. Les catalogues de données deviennent le point d’entrée utilisé par les statisticiens et analystes de données de tous bords par l’entremise des ingénieurs de données (Figure 1), dont le rôle consiste notamment à générer des ensembles de données enrichis à des fi ns analytiques. Les catalogues de données assurent à ces équipes dis- séminées de pouvoir collaborer sur la qualité de l’ensem- ble de données, l’utilisation et les descriptions commerciales. AUTOMNE 2017 | THE DOPPLER | 19