The Doppler Quarterly (DEUTSCHE) Sommer 2016 | Page 41
• Datenzugriff und -abruf – Anbieter von Cloud-Lösungen stellen eine
Vielzahl von Tools für den Zugriff auf Daten über SQL-Schnittstellen,
Tools für die Speicherung von Daten in JSON-Objekten, optimierte Platt-
formen für den Nur-Lese-Zugriff sowie Tools für die Batchverarbeitung
unstrukturierter Daten zur Verfügung. Diese Tools sollten bei der Kon-
zeption eines Datenlakes berücksichtigt werden, einschließlich der not-
wendigen Schnittstellen für die Erfassung und Verarbeitung der Daten.
Später werden in diesem Dokument noch spezielle Technologien von
AWS und Google für den Datenzugriff und -abruf erläutert. Eine gemein-
same Plattform für Metadaten sollte auch für einen optimierten Daten-
zugriff vorgesehen werden.
• Sicherheitskontrollen, Protokollierung und Überprüfung – Die
Sicherheit ist ein wesentliches Element eines Datenlakes. Identitätsma-
nagement, Überprüfung und Zugangskontrollen sollten so konzipiert
sein, dass sie den Risikograd des Unternehmens sowie die Complian-
ce-Anforderungen erfüllen. Die Zugriffskontrollen sollten bei verschie-
denen Zugriffsmethoden einheitlich sein.
• Bereitstellung und Automatisierung – Der enorme geschäftliche
Nutzen ergibt sich aus der Möglichkeit, die Bereitstellung und Wieder-
herstellung in der Cloud zu automatisieren. Alle Funktionen eines Daten-
lakes sollten für die Bereitstellung und Wiederherstellung automatisiert
werden, um den operativen Aufwand für die IT-Mitarbeiter bei Änderun-
gen und bei der Bearbeitung von Vorfällen zu verringern.
• Erweitertes Funktionsspektrum – Zu den erweiterten Funktionen
gehören APIs für die Datenanalyse oder Entwicklungs-Toolkits, mit denen
die Mitarbeiter schnell neue Analysen und Berichte erstellen können.
In Abbildung 5 ist das empfohlene Konzeptionsmuster für einen cloudbasierten
Datenlake dargestellt, einschließlich der Verbindungen zu traditionellen
Unternehmenssystemen.
Datennutzer
Datenlake
Vorhersageanalysen
Maschinelles Lernen
Datenverarbeitung
im Datenlake
Dashboards
Datenspeicherung und -wieder-
herstellung im Datenlake
Governance-
Richtlinien
ETL-Engine
Regeln/Abgleich-
Engine
E-Commerce
Streaming
Analytics
Metadaten
Datenwissenschaft
BI
Mobile Apps
Datenintegration
Objektspeicher
Langzeitarchiv
Abbildung 5: Funktionale Architektur eines Datenlakes
SOMMER 2016 | THE DOPPLER | 39