The Doppler Quarterly (FRANÇAIS) L'automne 2017 | Page 23
puyant sur un modèle collaboratif. Ce modèle mise sur l’instauration d’une confi -
ance mutuelle entre les équipes impliquées : en intégrant leurs ensembles de don-
nées dans un catalogue de données centralisé, elles ont accès à des ensembles
enrichis par les autres services de la société. Ce modèle repose sur l’hypothèse que
chaque service bénéfi cie d’une accélération de la livraison des produits grâce à la
faculté d’accéder aux données et aux initiatives des autres groupes.
Un catalogue de données agit comme un outil technologique exploitable de manière
minimale et quasiment autonome. Toutefois, sa réelle effi cacité se fait jour en tant
qu’élément central d’une initiative plus étendue de gouvernance des données. La
fi gure 2 illustre l’utilisation d’un catalogue de données dans le contexte d’autres
techniques et composants de processus très utiles, généralement déployés dans le
cadre d’une mise en œuvre de gouvernance des données.
Les fonctionnalités environnantes les plus communes à déployer comprennent :
Les métadonnées|: elles sont créées grâce à un enrichissement des ensembles de
données primaires au moyen de descriptions, d’éléments communs de liaison, de
mesures de qualité, ainsi que d’autres détails spécifi ques aux ensembles de données
nécessaires aux consommateurs de données pour bénéfi cier de l’exploitation la
plus effi cace possible des ensembles de données. C’est là que réside le cœur de l’in-
térêt d’un catalogue de données : un « metastore » communément accessible, grâce
auquel les différents outils de consommation et de requête peuvent accéder aux
données d’entreprise sous-jacentes via un ensemble de défi nitions de données
cohérent.
La qualité des données|: à mesure que les données servent à piloter des procédures
et des prises de décisions de plus en plus automatisées, la qualité des données doit
être étalonnée en fonction du niveau de risque. Certaines catégories de risques
plus faibles telles que le marketing ciblé ne nécessitent pas une qualité de données
extrême, car l’impact des inexactitudes est relativement modéré. À l’inverse, dans
certains autres domaines caractérisés par un risque plus élevé, comme les infor-
mations fi nancières personnelles ou relatives à la santé, la qualité des données est
primordiale, car toute imprécision peut se solder par de lourdes conséquences.
Glossaire d’entreprise|: de nombreuses organisations emploient leurs propres ter-
mes et acronymes pour décrire les organisations, relations, chaînes de valeur et
systèmes commerciaux d’assistance. Le catalogue de données sert de méthode pri-
maire pour capturer ces descriptions spécifi ques sur le plan organisationnel et
pour les mettre en correspondance avec les ensembles de données associés.
Données principales| : l’effi cacité de la centralisation des données d’entreprise
repose sur un principe important, qui est que certains éléments de données partic-
ulièrement stratégiques résident au cœur de la majorité des activités commercia-
les. L’assurance que ces éléments sont maintenus, référencés et invoqués de façon
cohérente est d’une importance cruciale pour l’exploitation des données
principales.
Lignage des données|: l’importance de procéder à un suivi de l’historique, des ram-
ifi cations et des modifi cations d’un ensemble de données ne saurait être sures-
timée. À mesure que les ingénieurs de données combinent et manipulent les ensem-
bles de données pour simplifi er leur exploitation par les utilisateurs professionnels,
les ensembles de données sources et les changements ultérieurs doivent faire l’ob-
AUTOMNE 2017 | THE DOPPLER | 21