The Doppler Quarterly (FRANÇAIS) L'automne 2017 | Page 23

puyant sur un modèle collaboratif. Ce modèle mise sur l’instauration d’une confi - ance mutuelle entre les équipes impliquées : en intégrant leurs ensembles de don- nées dans un catalogue de données centralisé, elles ont accès à des ensembles enrichis par les autres services de la société. Ce modèle repose sur l’hypothèse que chaque service bénéfi cie d’une accélération de la livraison des produits grâce à la faculté d’accéder aux données et aux initiatives des autres groupes. Un catalogue de données agit comme un outil technologique exploitable de manière minimale et quasiment autonome. Toutefois, sa réelle effi cacité se fait jour en tant qu’élément central d’une initiative plus étendue de gouvernance des données. La fi gure 2 illustre l’utilisation d’un catalogue de données dans le contexte d’autres techniques et composants de processus très utiles, généralement déployés dans le cadre d’une mise en œuvre de gouvernance des données. Les fonctionnalités environnantes les plus communes à déployer comprennent : Les métadonnées|: elles sont créées grâce à un enrichissement des ensembles de données primaires au moyen de descriptions, d’éléments communs de liaison, de mesures de qualité, ainsi que d’autres détails spécifi ques aux ensembles de données nécessaires aux consommateurs de données pour bénéfi cier de l’exploitation la plus effi cace possible des ensembles de données. C’est là que réside le cœur de l’in- térêt d’un catalogue de données : un « metastore » communément accessible, grâce auquel les différents outils de consommation et de requête peuvent accéder aux données d’entreprise sous-jacentes via un ensemble de défi nitions de données cohérent. La qualité des données|: à mesure que les données servent à piloter des procédures et des prises de décisions de plus en plus automatisées, la qualité des données doit être étalonnée en fonction du niveau de risque. Certaines catégories de risques plus faibles telles que le marketing ciblé ne nécessitent pas une qualité de données extrême, car l’impact des inexactitudes est relativement modéré. À l’inverse, dans certains autres domaines caractérisés par un risque plus élevé, comme les infor- mations fi nancières personnelles ou relatives à la santé, la qualité des données est primordiale, car toute imprécision peut se solder par de lourdes conséquences. Glossaire d’entreprise|: de nombreuses organisations emploient leurs propres ter- mes et acronymes pour décrire les organisations, relations, chaînes de valeur et systèmes commerciaux d’assistance. Le catalogue de données sert de méthode pri- maire pour capturer ces descriptions spécifi ques sur le plan organisationnel et pour les mettre en correspondance avec les ensembles de données associés. Données principales| : l’effi cacité de la centralisation des données d’entreprise repose sur un principe important, qui est que certains éléments de données partic- ulièrement stratégiques résident au cœur de la majorité des activités commercia- les. L’assurance que ces éléments sont maintenus, référencés et invoqués de façon cohérente est d’une importance cruciale pour l’exploitation des données principales. Lignage des données|: l’importance de procéder à un suivi de l’historique, des ram- ifi cations et des modifi cations d’un ensemble de données ne saurait être sures- timée. À mesure que les ingénieurs de données combinent et manipulent les ensem- bles de données pour simplifi er leur exploitation par les utilisateurs professionnels, les ensembles de données sources et les changements ultérieurs doivent faire l’ob- AUTOMNE 2017 | THE DOPPLER | 21