The Doppler Quarterly (DEUTSCHE) Herbst 2017 | Page 21

Warum Datenkataloge der Dreh- und Angelpunkt Ihrer Clouddatenstrategie sein sollten Joey Jablonski und Neal Matthews Effektive, datenorientierte Unter- nehmen nutzen Datenkataloge, um einen vollständigen Überblick über die verfügbaren Daten an einem leicht zugänglichen und zentral ver- walteten Ort zu erhalten. Data-Lakes sind zur Basis für die Datenumgebungen vieler Unternehmen geworden. Obwohl diese Data-Lakes neue Funktionen bereitstellen, haben viele Unternehmen Schwierigkeiten, diese umfas- send zu nutzen. Häufig haben sie mit dem Manage- ment mehrerer neuer Schnittstellen, Tools, Daten- sätze und Integrationspunkte zu kämpfen. Die Data-Lakes werden jedoch oft zu „Datensümpfen“. Ursächlich hierfür ist die große Datenmenge, die für die Datensatzsuche, das bedarfsorientierte Trennen der Daten und die Ermittlung des konkreten Nutzens für das Unternehmen ohne klares Konzept gesam- melt wird. Der Nutzen von Datenkatalogen Warum sollten Sie sich um die Bereitstellung von Datenkatalogfunktionen kümmern? Während viele Unternehmen mittlerweile die Bedeutung der Zent- ralisierung ihrer Unternehmensdaten erkannt haben, haben sie sich oft noch nicht damit auseinanderge- setzt, wie schwierig es ist, effizient und sicher auf diese Daten zuzugreifen. Diese Problemstellung resultiert daraus, dass die Daten aus vielen verschie- denen Orten mit unterschiedlicher Struktur zusam- mengetragen werden. Datenkataloge sind ein entscheidendes Element für alle Data-Lake-Implementierungen. Über sie wird sichergestellt, dass Datensätze verfolgt, anhand von geschäftlichen Begrifflichkeiten ermittelt, reguliert und verwaltet werden. Forbes-Mitarbeiter Dan Woods warnt Organisationen davor, Stammeswissen als Strategie zu verwenden, da es nicht skalierbar ist. 1 . Datenkataloge verdeutlichen die Umsetzung der unternehmensspezifischen Datengovernancerichtli- nien in die Praxis und werden so zum Durchset- zungsmotor und zum Werkzeug für die Compliance- prüfung. Die integrative Natur des Datenkatalogs ermöglicht die Nutzung für die Zusammenarbeit und den zentralen Austausch von Informationen an einem bekannten Ort, auf den unternehmensweit zugegrif- fen werden kann. Datenkataloge werden zum Einstiegspunkt für Datenwissenschaftler und andere analytische Anwender im gesamten Unternehmen und Datenent- wickler (Abbildung 1), die sich auf die Erstellung auf- bereiteter Datensätze für analytische Zwecke kon- zentrieren. Datenkataloge stellen sicher, dass diese verstreuten Teams gemeinsam an der Qualität und der Nutzung der Datensätze und den Geschäftsbe- schreibungen arbeiten können. Herbst 2017 | THE DOPPLER | 19