The Doppler Quarterly (FRANÇAIS) Printemps 2017 - Page 32

Garantir la qualité tout au long de la migration de vos données vers le cloud Amit Dutta, Joey Jablonski et Seth Rao Avant tout déploiement analytique majeur dans le cloud, il est essentiel que votre entreprise défi nisse des normes clés pour la qualité des données. Le cloud permet aux entreprises d'accroître l'empreinte de leurs données plus rapidement que les datacenters traditionnels ne l'ont jamais permis. Parallèlement, la multiplication des outils de pointe destinés à la science des données permet à un public plus vaste au sein des entreprises d'analyser les données et d'identifi er de nouvelles perspectives. Toutefois, cela peut entraîner de faibles niveaux d'erreur lors du transfert de données entre différents systèmes informatiques, avec ou sans cloud. Même un seul niveau d'erreur PPM (partie par million) pourrait être signifi catif, compte tenu des cen- taines de millions d'enregistrements transférés chaque jour. Ces erreurs peuvent avoir une incidence sur l'en- treprise si elles ne sont pas traitées de façon proactive. La rencontre de l'adoption du cloud et des scientifi ques spécialistes des données individuelles exige des entre- prises qu'elles fournissent aux analystes des jeux de données documentés de haute qualité. La promesse du cloud en termes de stockage de données repose sur la certitude que l'intégrité des données sera préservée lors de leur transfert entre différents systèmes et plate- formes informatiques. Cet article décrit les exigences requises pour atteindre une qualité de données orientée métier. Tolérance des erreurs Les utilisateurs de cloud doivent se méfi er des données de mauvaise qualité qui pénètrent dans leurs écosys- tèmes. Compte tenu du faible coût d'une publicité ciblée, pour les données axées sur le marketing ciblé, un niveau 30 | THE DOPPLER | PRINTEMPS 2017 d'erreur plus élevé des données post-analyse est plus acceptable. Cependant, lorsque les données sont stratégiques d'un point de vue juridique ou sur le plan des relations publiques ou de la conformité, les erreurs peuvent s'avérer coûteuses. Par exemple, les données requises pour la gouvernance d'entreprise ou de secteur d'une institution de services fi nanciers doivent mainte- nir un niveau d'exactitude de 100 % afi n que les actions soient attribuées avec précision et que les taxes soient calculées correctement. Défi s de cloud Les avantages du transfert de données vers le cloud sont très alléchants. Les principaux prestataires de cloud proposent une offre impressionnante qui est extrême- ment économique en comparaison des coûts sur site. Le cloud a ouvert de nouvelles perspectives, mais ces avan- tages présentent également des défi s pour l'intégration des données. Le plus grand changement dans le cloud, lors du remplacement de la gestion des données sur site, est la large gamme de services disponibles pour le stock- age, le traitement et l'analyse des données. Pourtant, chaque service introduit de nouveaux défi s pour la manipulation des données, ce qui se traduit par un résultat qui peut ne pas atteindre le niveau de qualité exigé par l'entreprise. Alors pourquoi changer ? Parce que l'exploitation des plateformes cloud offre la fl exibil- ité de stocker les données dans divers formats, tout en optimisant la technologie de la plateforme en fonction d'analyse et de requête des utilisateurs. Mais les prestataires de cloud, bien qu'ils soient encore à un stade précoce de maturité, ne disposent pas encore des outils nécessaires pour s'assurer que les données sont aptes à être utilisées lorsqu'elles sortent du cloud. Les contrôles de base que nous tenons pour acquis dans un environnement SGBDR sont inexistants. Au fur et à