The Doppler Quarterly (FRANÇAIS) Printemps 2017 | Page 26

Une liste typique d'activités analytiques dans une grande entreprise peut ressem- bler à ce qui suit : • Calcul mensuel d'exploration de données qui implique l'exécution de réseaux neuronaux à grande échelle sur un cluster de vingt nœuds • Filtrage, regroupement et synthèse des téraoctets de données pendant le week-end pour le tableau de bord des dirigeants du lundi. • Déduplication fl oue de nuit et processus de couplage d'enregistrements à travers plusieurs fl ux de données, pour la liaison et le regroupement de ces données. • Recherches en texte intégral sur des téraoctets de texte nécessitant un temps de réponse inférieur à la seconde Il est tout simplement impossible de procéder à une standardisation sur un petit ensemble d'outils qui est gracieusement au service de tous ces modèles sans se heurter à des problèmes de performance. Si nous imposons des normes d'entre- prise aux utilisateurs, ils se mettent à générer des centaines de fl ux en dehors de l'entrepôt de données pour exécuter des charges de travail spécifi ques, principale- ment à l'aide d'Excel. Nous avons vu une grande entreprise utiliser Business Objects principalement comme source de données pour Excel. La dépendance à l'égard des services informatiques s'accroît, la Business Intelligence en libre-service reste une aspiration et la prolifération des feuilles de calcul Excel gagne tous les niveaux de l'entreprise. Pour favoriser l'innovation au sein de l'entreprise, l'infrastructure ana- lytique doit prendre en charge une multitude de schémas d'analyse et d'outils en amont. La persistance relationnels polyglotte plutôt que des modèles Dans l'un de ses blogs, James Serra défi nit la persistance polyglotte comme suit : « La « persistance polyglotte » est un terme fantaisiste pour indiquer que lors du stockage de données, il est préférable d'avoir recours à plusieurs technologies de stockage de données, choisies en fonction de la façon dont les données sont util- isées par des applications individuelles ou les composants d'une seule application. » Speculative Retailers Web Application Sessions utilisateurs Données financières Panier Recommandations Redis SGBDR Riak Neo4J Catalogue produits Reporting Analyses Journaux d’activités utilisateurs MongoDB SGBDR Cassandra Cassandra Figure|3|: Un exemple d'application de commerce électronique avec la persistance polyglotte 24 | THE DOPPLER | PRINTEMPS 2017