The Doppler Quarterly (DEUTSCHE) Sommer 2016 - Page 41

• Datenzugriff und -abruf – Anbieter von Cloud-Lösungen stellen eine Vielzahl von Tools für den Zugriff auf Daten über SQL-Schnittstellen, Tools für die Speicherung von Daten in JSON-Objekten, optimierte Platt- formen für den Nur-Lese-Zugriff sowie Tools für die Batchverarbeitung unstrukturierter Daten zur Verfügung. Diese Tools sollten bei der Kon- zeption eines Datenlakes berücksichtigt werden, einschließlich der not- wendigen Schnittstellen für die Erfassung und Verarbeitung der Daten. Später werden in diesem Dokument noch spezielle Technologien von AWS und Google für den Datenzugriff und -abruf erläutert. Eine gemein- same Plattform für Metadaten sollte auch für einen optimierten Daten- zugriff vorgesehen werden. • Sicherheitskontrollen, Protokollierung und Überprüfung – Die Sicherheit ist ein wesentliches Element eines Datenlakes. Identitätsma- nagement, Überprüfung und Zugangskontrollen sollten so konzipiert sein, dass sie den Risikograd des Unternehmens sowie die Complian- ce-Anforderungen erfüllen. Die Zugriffskontrollen sollten bei verschie- denen Zugriffsmethoden einheitlich sein. • Bereitstellung und Automatisierung – Der enorme geschäftliche Nutzen ergibt sich aus der Möglichkeit, die Bereitstellung und Wieder- herstellung in der Cloud zu automatisieren. Alle Funktionen eines Daten- lakes sollten für die Bereitstellung und Wiederherstellung automatisiert werden, um den operativen Aufwand für die IT-Mitarbeiter bei Änderun- gen und bei der Bearbeitung von Vorfällen zu verringern. • Erweitertes Funktionsspektrum – Zu den erweiterten Funktionen gehören APIs für die Datenanalyse oder Entwicklungs-Toolkits, mit de­nen die Mitarbeiter schnell neue Analysen und Berichte erstellen können. In Abbildung 5 ist das empfohlene Konzeptionsmuster für einen cloudbasierten Datenlake dargestellt, einschließlich der Verbindungen zu traditionellen Unternehmenssystemen. Datennutzer Datenlake Vorhersageanalysen Maschinelles Lernen Datenverarbeitung im Datenlake Dashboards Datenspeicherung und -wieder- herstellung im Datenlake Governance- Richtlinien ETL-Engine Regeln/Abgleich- Engine E-Commerce Streaming Analytics Metadaten Datenwissenschaft BI Mobile Apps Datenintegration Objektspeicher Langzeitarchiv Abbildung 5: Funktionale Architektur eines Datenlakes SOMMER 2016 | THE DOPPLER | 39