The Doppler Quarterly (DEUTSCHE) Sommer 2016 | Page 36
Einrichtung einer Plattform für
maschinelles Lernen und Analysen
Joey Jablonski
Einführung
Vorhersageanalysen und unterstützende Technologien wie maschinelles Ler-
nen erfordern den Zugriff auf verschiedene Datensätze und leistungsstarke,
skalierbare Rechenressourcen. Dank moderner Funktionen wie Vorhersage-
analysen und maschinelles Lernen können Unternehmen große Datenmengen
aus sozialen Medien, Onlinevorgängen, dem Internet of Things (IoT) und ande-
ren Quellen nutzen, um datengesteuerte Entscheidungen im gesamten Unter-
nehmen zu treffen. Durch die Nutzung eines Datenlakes zur Speicherung der
notwendigen Informationen für Workloads im Zusammenhang mit Vorhersa-
geanalysen und maschinellem Lernen können Mitarbeiter im gesamten Unter-
nehmen Daten analysieren, Theorien testen und Änderungen an Geschäfts-
prozessen, Kundenerlebenis und Produkten vornehmen.
Ein Datenlake ist nicht als Ersatz für bestehende Systeme gedacht. Es ist viel-
mehr ein Integrationspunkt zwischen bestehenden Datenplattformen, um
nahtlose Einblicke in alle Unternehmensdaten zu ermöglichen. Ein Datenlake
ergänzt bestehende Systeme, da er sicherstellt, dass analytische Workloads
und das Erstellen von Modellen für Entwicklung, Test und maschinelles Lernen
keinen Einfluss auf Produktionsworkloads auf anderen leistungsoptimierten
Systemen haben. Letztendlich ist ein Datenlake ein Konzept, und obwohl er
über einige spezielle Technologien und Workflows verfügt, liegt sein geschäft-
licher Nutzen in der Verbindung zwischen den zentralen Komponenten des
Datenlakes und den unterstützenden geschäftlichen und operativen
Systemen.
Die Einrichtung eines Datenlakes erfordert, dass Unternehmen die Datenstra-
tegie, Infrastrukturarchitektur und Workflows bewerten. So soll sichergestellt
werden, dass die verfügbaren Daten von hoher Qualität sind, für schnelle Ana-
lysen miteinander verknüpft sind und sich durch fehlerhafte Daten keine Risi-
ken für das Unternehmen ergeben oder Compliance-Probleme bewältigt wer-
den müssen. In Abbildung 1 sind die gängigen Schritte dargestellt, die ein
Unternehmen bei der Einrichtung eines Datenlakes zu Beginn durchführen
muss. Hinzu kommen die wichtigsten technischen und organisatorischen
Überlegungen, die zur erfolgreichen Implementierung eines Datenlakes
berücksichtigt werden müssen.
34 | THE DOPPLER | SOMMER 2016