The Doppler Quarterly (DEUTSCHE) Frühjahr 2017 - Page 28

Martin Fowler erklärt in seinem Blog zu Polyglot Persistence: „Meiner Meinung nach sollten Sie bei der Einführung einer neuen strategi- schen Unternehmensanwendung nicht mehr automatisch von relationaler Per- sistenz ausgehen. Die relationale Option könnte durchaus richtig sein, Sie soll- ten jedoch auch andere Alternativen ernsthaft in Erwägung ziehen.“ Sie müssen eine bestimmte Workload mit einer Ausführungsengine kombinie- ren, die für sie maßgeschneidert ist. Sie könnten Volltextsuchläufe in Ihrem Data Warehouse oder sogar Ihrem NoSQL-MongoDB-Cluster durchführen, doch dieser Ansatz wird die Leistung einer ElasticSearch Engine nicht über- treffen. Stellen Sie sich eine Welt vor, in der das Unternehmen auf Folgendem basiert: einem von Hadoop Distributed File System (HDFS) gestützten Data Lake, einer Data-Warehouse-Appliance mit massiver Parallelverarbeitung (MPP) für sehr datengierige, intensive gemeinsame Abfragen, Apache Hive auf Tez mit LLAP für SQL-Batchabfragen, Apache Spark für die Streamanalyse und das maschinelle Lernen, einem ElasticSearch-Cluster für die suchbasierte Analyse und einem Produktkatalog auf Grundlage von MongoDB. Die Entwicklung der Infrastruktur, Prozesse und Kenntnisse als Grundlage und zur Unterstützung so unterschiedlicher Technologien erfordert vom Unternehmen einen grundlegenden strategischen Wandel und eine langfris- tige Verfolgung dieses Wandels mit entsprechenden Kosten. Cloud statt On-Premise-Implementierung • Wie modernisieren wir unsere Analyseinfrastruktur, um eine große Bandbreite von Workloads zu unterstützen und den Geschäftsanwen- dern damit maximale Wertschöpfung zu ermöglichen? • Wie kann die IT-Abteilung Self-Service anbieten und den Weg für Inno- vation frei machen? • Wie schaffen wir das so wirtschaftlich wie möglich? Unternehmen müssen ernsthaft in Betracht ziehen, ihre Analyseworkloads in die Cloud zu migrieren. Dies ist eine selbstheilende, automatisch skalierende Infrastruktur mit mehreren Clustern, die eine Vielzahl von Tools und Workloads unterstützen und die Self-Service-Analyse möglich machen. Die Cloud verrin- gert die Ausfallzeiten und die Gesamtbetriebskosten (TCO) erheblich – und dies bei höherer 1չչMɡи) Q@Ёɕ́ɕɔUѕɹ՘͕]Ʌиɑ)ջЁ́Aљȁ͕ݕչͽɝѥѕЁչ)Q <5ѕа́Yѕȁ Ր]͍ѱ)ٽɡи)]ѥͥչєȁ5ɹͥչ)]ȁͥ՝а́́ȁUѕɹȁ͍ݥɥȁݥɐ)=Aɕ͔͕ɅխȁՙՉՕԁչݕѕՕݤ)ᕸمɥѕ͔չ ɥͅɑո)չѕɹݕЁչѕи]ȁ͡ٽ̰́M)Uѕɹ́iյ͕ٽYѕȁ ՐQ)ȁф]ɕ͔5ɹͥչԁɽѥɕ%)ѕݥȁɅѕ͍7ٝѕȁݕѕɔYɝݕ͔)ٽȸ(؁Q!=AA1HKq!)!H