The Doppler Quarterly (FRANÇAIS) Printemps 2017 | Page 29

Cloud hybride Même pour les entreprises qui se sont sincèrement engagées à adopter le cloud, nous recommandons une approche hybride pour démarrer. La première étape con- siste à segmenter clairement le système actuel en un ensemble de charges de tra- vail bien défi nies et mappées à des composants spécifi ques. Il n'est pas conseillé de déplacer toutes les charges de travail dans le cloud en une seule phase, même si vous envisagez des opérations simples de type Lift and Shift. Chez CTP, notre pro- gramme d'adoption du cloud fournit une feuille de route normative qui explique en détail comment transférer systématiquement vos charges de travail vers le cloud. Nous vous recommandons de rester délibérément hybride dans un premier temps pendant que vous apprenez, éduquez et gérez le changement. Lac de données d'entreprise Notre discussion précédente sur le schéma à la lecture (avec plusieurs moteurs d'analyse imposant un schéma de leur choix au moment de la lecture des données) conduit naturellement au concept de développement d'un lac de données d'entre- prise. Cet endroit permet de collecter et stocker des données d'entreprise, struc- turées ou non, sans se soucier de les structurer davantage Le lac de données d'entreprise est généralement développé sur un système Hadoop Distributed File System (HDFS) qui permet le calcul parallèle et distribué sur des ensembles de données massifs, et s'adapte à la croissance de l'entreprise et de ses données sensibles. HDInsights Périphériques Social Applications métier Vidéo Applications métier Périphériques Social Vidéo Relational Web Web Capteurs Relationnel Clickstream Capteurs Clickstream Lac de données Microsoft Azure Figure|4|: Lac de données Microsoft Azure Clusters éphémères Lors de la migration de clusters volumineux sur site avec d'énormes machines MPP vers une infrastructure basée sur le cloud, nous ne devrions pas envisager des clus- ters toujours en service, à long terme, sauf si nous en avons absolument besoin. Pour la plupart des utilisations avancées des données d'entreprise, en particulier les charges de travail liées à la science des données, nous ne nous intéressons qu'aux résultats fi naux de l'analyse. Le cloud vous offre la facilité et les économies associées en vous permettant de démarrer automatiquement un cluster volu- mineux, de calculer les résultats et de l'arrêter une fois le travail terminé. Les résul- tats peuvent être exploités à l'aide d'outils de reporting ou de tableau de bord pour une analyse plus approfondie ou un reporting destiné aux cadres. PRINTEMPS 2017 | THE DOPPLER | 27