The Doppler Quarterly (DEUTSCHE) Sommer 2016 | Page 36

Einrichtung einer Plattform für maschinelles Lernen und Analysen Joey Jablonski Einführung Vorhersageanalysen und unterstützende Technologien wie maschinelles Ler- nen erfordern den Zugriff auf verschiedene Datensätze und leistungsstarke, skalierbare Rechenressourcen. Dank moderner Funktionen wie Vorhersage- analysen und maschinelles Lernen können Unternehmen große Datenmengen aus sozialen Medien, Onlinevorgängen, dem Internet of Things (IoT) und ande- ren Quellen nutzen, um datengesteuerte Entscheidungen im gesamten Unter- nehmen zu treffen. Durch die Nutzung eines Datenlakes zur Speicherung der notwendigen Informationen für Workloads im Zusammenhang mit Vorhersa- geanalysen und maschinellem Lernen können Mitarbeiter im gesamten Unter- nehmen Daten analysieren, Theorien testen und Änderungen an Geschäfts- prozessen, Kundenerlebenis und Produkten vornehmen. Ein Datenlake ist nicht als Ersatz für bestehende Systeme gedacht. Es ist viel- mehr ein Integrationspunkt zwischen bestehenden Datenplattformen, um nahtlose Einblicke in alle Unternehmensdaten zu ermöglichen. Ein Datenlake ergänzt bestehende Systeme, da er sicherstellt, dass analytische Workloads und das Erstellen von Modellen für Entwicklung, Test und maschinelles Lernen keinen Einfluss auf Produktionsworkloads auf anderen leistungsoptimierten Systemen haben. Letztendlich ist ein Datenlake ein Konzept, und obwohl er über einige spezielle Technologien und Workflows verfügt, liegt sein geschäft- licher Nutzen in der Verbindung zwischen den zentralen Komponenten des Datenlakes und den unterstützenden geschäftlichen und operativen Systemen. Die Einrichtung eines Datenlakes erfordert, dass Unternehmen die Datenstra- tegie, Infrastrukturarchitektur und Workflows bewerten. So soll sichergestellt werden, dass die verfügbaren Daten von hoher Qualität sind, für schnelle Ana- lysen miteinander verknüpft sind und sich durch fehlerhafte Daten keine Risi- ken für das Unternehmen ergeben oder Compliance-Probleme bewältigt wer- den müssen. In Abbildung 1 sind die gängigen Schritte dargestellt, die ein Unternehmen bei der Einrichtung eines Datenlakes zu Beginn durchführen muss. Hinzu kommen die wichtigsten technischen und organisatorischen Überlegungen, die zur erfolgreichen Implementierung eines Datenlakes berücksichtigt werden müssen. 34 | THE DOPPLER | SOMMER 2016