The Doppler Quarterly (DEUTSCHE) Sommer 2016 - Page 39

Big Data-Reifegrad Personen Level 1 – Datenzugriff • Level 2 – Konsolidierung • Level 3 – Berichterstellung • • • Prozessausgereiftheit • Nach Speicherkapazität ETL, DBA • Nach Erfahrung Datenqualität • Dokumentiert und Grundlegende IT-/ Computerkenntnisse Statistikdaten reproduzierbar Entwicklung Level 4 – Warnhinweise • Erweiterte Statistiken • Automatisiert Level 5 – Einbindung • NLP, Vorhersagen, Mod- • Lernen und Weiterbilden ellerstellung, Mathematik, maschinelles Lernen Abbildung 2: Big Data-Reifegrad In Abbildung 2 ist der zunehmende Reifegrad bei der Einführung von Big Data-Lösungen in Unternehmen dargestellt. Während sich Unternehmen durch verschiedene Level weiterentwickeln, müssen die Faktoren Technologie, Mitarbeiter und Prozesse berücksichtigt werden. Ein Datenlake wird üblicher- weise eingesetzt, um die Entwicklung von Level 3 über Level 4 bis hin zu Level 5 zu fördern. Ein Datenlake bietet eine Plattform für die Ausführung fortschritt- licher Technologien und einen Ort, an dem die Mitarbeiter ihre Kompetenzen in den Bereichen Datenanalyse und Datenwissenschaft erweitern können. Der geschäftliche Nutzen eines Datenlakes Der hauptsächliche geschäftliche Nutzen eines Datenlakes liegt in der Flexibi- lität durch eine skalierbare Plattform für die Analyse komplexer Datensätze. In diese Analyse fließen viele verschiedene Technologien ein, z. B. Tools für Vor- hersageanalysen, Datenmodellierung, Datenqualität und maschinelles Lernen. Der erste Teil jedes Analyseworkflows ist der Datenprozess. In Abbildung  3 sind die üblichen Schritte (Erfassung, Cluster, Index, Analyse) in einem Daten- lake dargestellt. Diese Schritte sind entscheidend, um sicherzustellen, dass qualitativ hochwertige Daten zusammengeführt, richtig zugeordnet und orga- nisiert werden, damit Datenwissenschaftler die aufbereiteten Daten analysie- ren können. Verarbei- tung Clustering Daten von verschiedenen Quellen und Partnern importieren Muster und Beziehungen erkennen Indexie- rung Analyse Beziehungen ermitteln und analysieren Abbildung 3: Analysekonzept bei Datenanalysen SOMMER 2016 | THE DOPPLER | 37