The Doppler Quarterly (FRANÇAIS) Printemps 2017 | Page 29
Cloud hybride
Même pour les entreprises qui se sont sincèrement engagées à adopter le cloud,
nous recommandons une approche hybride pour démarrer. La première étape con-
siste à segmenter clairement le système actuel en un ensemble de charges de tra-
vail bien défi nies et mappées à des composants spécifi ques. Il n'est pas conseillé de
déplacer toutes les charges de travail dans le cloud en une seule phase, même si
vous envisagez des opérations simples de type Lift and Shift. Chez CTP, notre pro-
gramme d'adoption du cloud fournit une feuille de route normative qui explique en
détail comment transférer systématiquement vos charges de travail vers le cloud.
Nous vous recommandons de rester délibérément hybride dans un premier temps
pendant que vous apprenez, éduquez et gérez le changement.
Lac de données d'entreprise
Notre discussion précédente sur le schéma à la lecture (avec plusieurs moteurs
d'analyse imposant un schéma de leur choix au moment de la lecture des données)
conduit naturellement au concept de développement d'un lac de données d'entre-
prise. Cet endroit permet de collecter et stocker des données d'entreprise, struc-
turées ou non, sans se soucier de les structurer davantage
Le lac de données d'entreprise est généralement développé sur un système Hadoop
Distributed File System (HDFS) qui permet le calcul parallèle et distribué sur des
ensembles de données massifs, et s'adapte à la croissance de l'entreprise et de ses
données sensibles.
HDInsights
Périphériques Social
Applications
métier Vidéo
Applications
métier
Périphériques
Social
Vidéo
Relational
Web
Web Capteurs
Relationnel Clickstream
Capteurs
Clickstream
Lac de données Microsoft Azure
Figure|4|: Lac de données Microsoft Azure
Clusters éphémères
Lors de la migration de clusters volumineux sur site avec d'énormes machines MPP
vers une infrastructure basée sur le cloud, nous ne devrions pas envisager des clus-
ters toujours en service, à long terme, sauf si nous en avons absolument besoin.
Pour la plupart des utilisations avancées des données d'entreprise, en particulier
les charges de travail liées à la science des données, nous ne nous intéressons
qu'aux résultats fi naux de l'analyse. Le cloud vous offre la facilité et les économies
associées en vous permettant de démarrer automatiquement un cluster volu-
mineux, de calculer les résultats et de l'arrêter une fois le travail terminé. Les résul-
tats peuvent être exploités à l'aide d'outils de reporting ou de tableau de bord pour
une analyse plus approfondie ou un reporting destiné aux cadres.
PRINTEMPS 2017 | THE DOPPLER | 27