The Doppler Quarterly (DEUTSCHE) Sommer 2017 - Page 14

TECHNISCHER RATGEBER Ratgeber: Architekturmuster, die beim Entwerfen eines Enterprise Data Lakes zu berücksichtigen sind Sudi Bhattacharya und Neal Matthews Dieser Artikel behandelt den Geschäftswert von Enterprise Data Lakes, das Design im Hinblick auf Speicher, Sicherheit und Gover- nance und wie Sie Ihre Big Data als wesentliches Element zur Gewin- nung wertvoller Informationen nut- zen können. Der Business Case Beginnen wir mit der Definition eines Data Lakes: „Ein Data Lake ist ein Repository zur Datenspeiche- rung, das riesige Mengen an Rohdaten, wie beispiels- weise strukturierte, semi-strukturierte und unstruk- turierte Daten, in ihrem Ursprungsformat bereithält. Dabei werden die Datenstruktur und -anforderungen erst definiert, wenn die Daten benötigt werden.“ ... Und nun die Frage: Warum sollten Sie diese Themen interessieren? Innovation In einem großen Unternehmen sind es vor allem die Innovationen, die dank eines Data Lakes ermöglicht werden. Wir haben viele Multi-Milliarden-Dollar-Un- ternehmen gesehen, die Probleme damit haben, eine Unternehmenskultur zu etablieren, die auf datenori- entierten Erkenntnissen und Innovationen beruht. Sie haben sich in strukturellen Silos festgefahren, die Datenspeicher auf Abteilungs- oder Geschäftsfelde- bene isolieren, und die durch massive organisatori- sche Richtlinien im Zusammenhang mit dem Besitz 12 | THE DOPPLER | SOMMER 2017 von Daten widergespiegelt werden. Ein Enterprise Data Lake ist zwar alles andere als einfach zu imple- mentieren, bietet jedoch die notwendige Grundlage, um das unternehmensweite Datenzugriffsproblem bereits an seinen Wurzeln zu beseitigen. Damit öffnet sich nicht nur die Tür zu bisher nicht verfügbaren explorativen Analysen und Data Mining, sondern bie- tet auch völlig neue Möglichkeiten. Geschwindigkeit In der heutigen dynamischen Geschäftsumgebung treten sehr schnell neue Datenverbrauchsanforde- rungen und Anwendungsfälle auf. Bis zu dem Zeit- punkt, an dem ein Anforderungsdokument im Hin- blick auf angeforderte Änderungen an Datenspeicher oder -schemas erstellt wurde, sind Benutzer häufig bereits zu einer anderen oder sogar widersprüchli- chen Reihe von Schemaänderungen übergegangen. Im Gegensatz dazu dreht sich die gesamte Philoso- phie eines Data Lakes darum, für einen unbekannten Anwendungsfall gerüstet zu sein. Wenn sich die Quelldaten in einem zentralen Datensee ohne Kont- rollstruktur oder eingebettetem Schema befinden, ist der Support eines neuen zusätzlichen Anwendungs- falls viel einfacher. Self-Service Wie lange dauert es durchschnittlich zwischen einer Anfrage an die IT für einen Bericht und der späteren Bereitstellung eines zuverlässigen Arbeitsberichts in Ihrem Unternehmen? In viel zu vielen Fällen lautet die Antwort Wochen oder sogar Monate. Mit einem rich- tig konzipierten Data Lake und einer gut ausgebilde- ten Busin \[][]H[X[\[\[[KB[HXH[T\XH\pX[\[[Z]\Z]\YܚY]Y\]Z[[YH][