The Doppler Quarterly (DEUTSCHE) Sommer 2016 | Page 39
Big Data-Reifegrad
Personen
Level 1 – Datenzugriff •
Level 2 – Konsolidierung •
Level 3 – Berichterstellung •
•
•
Prozessausgereiftheit
• Nach Speicherkapazität
ETL, DBA • Nach Erfahrung
Datenqualität • Dokumentiert und
Grundlegende IT-/
Computerkenntnisse
Statistikdaten
reproduzierbar
Entwicklung
Level 4 – Warnhinweise • Erweiterte Statistiken • Automatisiert
Level 5 – Einbindung • NLP, Vorhersagen, Mod- • Lernen und Weiterbilden
ellerstellung, Mathematik,
maschinelles Lernen
Abbildung 2: Big Data-Reifegrad
In Abbildung 2 ist der zunehmende Reifegrad bei der Einführung von Big
Data-Lösungen in Unternehmen dargestellt. Während sich Unternehmen
durch verschiedene Level weiterentwickeln, müssen die Faktoren Technologie,
Mitarbeiter und Prozesse berücksichtigt werden. Ein Datenlake wird üblicher-
weise eingesetzt, um die Entwicklung von Level 3 über Level 4 bis hin zu Level 5
zu fördern. Ein Datenlake bietet eine Plattform für die Ausführung fortschritt-
licher Technologien und einen Ort, an dem die Mitarbeiter ihre Kompetenzen
in den Bereichen Datenanalyse und Datenwissenschaft erweitern können.
Der geschäftliche Nutzen eines Datenlakes
Der hauptsächliche geschäftliche Nutzen eines Datenlakes liegt in der Flexibi-
lität durch eine skalierbare Plattform für die Analyse komplexer Datensätze. In
diese Analyse fließen viele verschiedene Technologien ein, z. B. Tools für Vor-
hersageanalysen, Datenmodellierung, Datenqualität und maschinelles Lernen.
Der erste Teil jedes Analyseworkflows ist der Datenprozess. In Abbildung 3
sind die üblichen Schritte (Erfassung, Cluster, Index, Analyse) in einem Daten-
lake dargestellt. Diese Schritte sind entscheidend, um sicherzustellen, dass
qualitativ hochwertige Daten zusammengeführt, richtig zugeordnet und orga-
nisiert werden, damit Datenwissenschaftler die aufbereiteten Daten analysie-
ren können.
Verarbei-
tung
Clustering
Daten von verschiedenen Quellen und Partnern
importieren
Muster und Beziehungen erkennen
Indexie-
rung
Analyse
Beziehungen ermitteln und analysieren
Abbildung 3: Analysekonzept bei Datenanalysen
SOMMER 2016 | THE DOPPLER | 37