The Doppler Quarterly (FRANÇAIS) Printemps 2017 | Page 28

Sur son blog dédié à la persistance polyglotte , Martin Fowler proclame :
« Je suis persuadé que si vous lancez une nouvelle application d ' entreprise stratégique , vous ne devriez plus supposer que votre persistance doit être relationnelle . L ' option relationnelle est peut-être la bonne , mais vous devriez envisager sérieusement d ' autres solutions . »
Vous devez associer une charge de travail spécifique à un moteur d ' exécution adapté . Vous pourriez lancer des recherches en texte intégral sur votre entrepôt de données , ou même sur votre cluster MongoDB NoSQL , mais cette approche ne va pas dépasser les performances d ' un moteur de recherche ElasticSearch . Imaginez un monde où l ' entreprise est soutenue par les éléments suivants : un lac de données soutenu par Hadoop Distributed File System ( HDFS ) ; une appliance d ' entrepôt de données de traitement massivement parallèle pour les requêtes intensives conjointes très gourmandes en ressources ; Apache Hive sur Tez avec LLAP pour les requêtes SQL par lot ; Apache Spark pour les activités d ' analyse de flux et d ' apprentissage automatique ; un cluster ElasticSearch pour les analyses basées sur la recherche et un catalogue de produits basé sur MongoDB .
Le développement de l ' infrastructure , des processus et des compétences nécessaires pour tirer parti d ' un ensemble de technologies aussi diversifié et les prendre en charge exige un changement stratégique fondamental et un engagement à long terme de la part de l ' entreprise envers ce changement et son coût .
Le cloud plutôt qu ' une solution sur site
• Comment moderniser notre infrastructure analytique pour prendre en charge un large éventail de charges de travail afin de permettre aux utilisateurs professionnels d ' en tirer le maximum de valeur ?
• Comment le service informatique autorise-t-il le libre-service au détriment de l ' innovation ?
• Comment y parvenir avec la meilleure rentabilité possible ?
Les entreprises doivent sérieusement envisager la migration de leurs charges de travail analytiques vers le cloud . Il s ' agit d ' une infrastructure auto-réparatrice , avec mise à l ' échelle automatique . Elle est dotée de multiples clusters qui prennent en charge de nombreux outils et charges de travail et permettent l ' analyse en libre-service . Le cloud réduira considérablement les temps d ' arrêt et le coût total de possession , avec des performances accrues et une sécurité renforcée .
Chez CTP , nous avons commencé ce processus avec de nombreuses entreprises en évaluant d ' abord soigneusement le portefeuille d ' applications analytiques et en développant un modèle de coût total de possession qui met en évidence les avantages de l ' économie du cloud .
Points principaux à retenir pour la modernisation
Nous croyons sincèrement qu ' il sera de plus en plus difficile pour une entreprise de développer , maintenir et faire évoluer une infrastructure d ' analyse sur site répondant aux besoins complexes et variés en matière de données , d ' analyses et de rapports à l ' échelle de l ' entreprise . Par conséquent , nous émettons l ' hypothèse critique qu ' en tant qu ' entreprise , vous vous engagez à tirer pleinement parti de la technologie de cloud pour moderniser votre entrepôt de données . Voici quelques façons stratégiques de procéder .
26 | THE DOPPLER | PRINTEMPS 2017