The Doppler Quarterly (FRANÇAIS) Printemps 2017 | Page 32
Garantir la qualité tout au long de la
migration de vos données vers le cloud
Amit Dutta, Joey Jablonski et Seth Rao
Avant tout déploiement analytique majeur
dans le cloud, il est essentiel que votre
entreprise défi nisse des normes clés pour
la qualité des données.
Le cloud permet aux entreprises d'accroître l'empreinte
de leurs données plus rapidement que les datacenters
traditionnels ne l'ont jamais permis. Parallèlement, la
multiplication des outils de pointe destinés à la science
des données permet à un public plus vaste au sein des
entreprises d'analyser les données et d'identifi er de
nouvelles perspectives. Toutefois, cela peut entraîner de
faibles niveaux d'erreur lors du transfert de données
entre différents systèmes informatiques, avec ou sans
cloud. Même un seul niveau d'erreur PPM (partie par
million) pourrait être signifi catif, compte tenu des cen-
taines de millions d'enregistrements transférés chaque
jour. Ces erreurs peuvent avoir une incidence sur l'en-
treprise si elles ne sont pas traitées de façon proactive.
La rencontre de l'adoption du cloud et des scientifi ques
spécialistes des données individuelles exige des entre-
prises qu'elles fournissent aux analystes des jeux de
données documentés de haute qualité. La promesse du
cloud en termes de stockage de données repose sur la
certitude que l'intégrité des données sera préservée lors
de leur transfert entre différents systèmes et plate-
formes informatiques. Cet article décrit les exigences
requises pour atteindre une qualité de données orientée
métier.
Tolérance des erreurs
Les utilisateurs de cloud doivent se méfi er des données
de mauvaise qualité qui pénètrent dans leurs écosys-
tèmes. Compte tenu du faible coût d'une publicité ciblée,
pour les données axées sur le marketing ciblé, un niveau
30 | THE DOPPLER | PRINTEMPS 2017
d'erreur plus élevé des données post-analyse est plus
acceptable. Cependant, lorsque les données sont
stratégiques d'un point de vue juridique ou sur le plan
des relations publiques ou de la conformité, les erreurs
peuvent s'avérer coûteuses. Par exemple, les données
requises pour la gouvernance d'entreprise ou de secteur
d'une institution de services fi nanciers doivent mainte-
nir un niveau d'exactitude de 100 % afi n que les actions
soient attribuées avec précision et que les taxes soient
calculées correctement.
Défi s de cloud
Les avantages du transfert de données vers le cloud sont
très alléchants. Les principaux prestataires de cloud
proposent une offre impressionnante qui est extrême-
ment économique en comparaison des coûts sur site. Le
cloud a ouvert de nouvelles perspectives, mais ces avan-
tages présentent également des défi s pour l'intégration
des données. Le plus grand changement dans le cloud,
lors du remplacement de la gestion des données sur site,
est la large gamme de services disponibles pour le stock-
age, le traitement et l'analyse des données. Pourtant,
chaque service introduit de nouveaux défi s pour la
manipulation des données, ce qui se traduit par un
résultat qui peut ne pas atteindre le niveau de qualité
exigé par l'entreprise. Alors pourquoi changer ? Parce
que l'exploitation des plateformes cloud offre la fl exibil-
ité de stocker les données dans divers formats, tout en
optimisant la technologie de la plateforme en fonction
d'analyse et de requête des utilisateurs.
Mais les prestataires de cloud, bien qu'ils soient encore à
un stade précoce de maturité, ne disposent pas encore
des outils nécessaires pour s'assurer que les données
sont aptes à être utilisées lorsqu'elles sortent du cloud.
Les contrôles de base que nous tenons pour acquis dans
un environnement SGBDR sont inexistants. Au fur et à