The Doppler Quarterly (DEUTSCHE) Sommer 2016 - Page 48

Unveränderliche Daten für alle Vorgänge – Alle Vorgänge, die in einem Daten- lake durchgeführt werden, sollten auf der Basis unveränderlicher Daten durch- geführt werden. So ist sichergestellt, dass fehlerhafte Prozesse oder Analysen entfernt werden können, ohne die Datenqualität für zukünftige Analysen zu beeinträchtigen. • Deidentifikation von Daten – Viele Unternehmen müssen sensible Daten verarbeiten, z. B. Gesundheits-, Finanz- oder persönliche Daten. Ein Datenlake stellt ein besonderes Risiko dar, da viele Personen auf Daten zugreifen können, die zuvor auf unabhängigen Systemen gespei- chert waren. Alle Daten, die in einem Datenlake gespeichert sind und einem großen Benutzerkreis zugänglich gemacht werden, sollten dei- dentifiziert werden, um den Schutz der Privatsphäre zu gewährleisten. In vielen Datenlakes gibt es getrennte Bereiche mit deidentifizierten und identifizierbaren Daten, wobei jeder Abschnitt für die jeweils berechtig- ten Mitarbeiter zugänglich ist. • Quelldatensatz – Ein Datenlake ruft Daten aus mehreren Quellen ab und übermittelt Analyseergebnisse zurück an die betrieblichen Systeme. Das setzt voraus, dass Unternehmen die Quelle von Datensätzen für jeden Datentyp sorgfältig verfolgen und verstehen, wie diese Informatio- nen zwischen den Systemen ausgetauscht und referenziert werden, um die Datenintegrität zu gewährleisten. • Zuordnung von Beziehungen – Da die unabhängigen Systeme in Unternehmen über viele Jahre hinweg immer größer geworden sind, sind die Beziehungen in den Daten komplex geworden. Eine erfolgreiche Datenlake-Lösung muss sicherstellen, dass die Datenelemente korrekt zugeordnet werden, sodass Berichte über Systeme, Zeiträume und Geschäftsbereiche hinweg erstellt werden können. • Metadaten-Katalog – Um sicherzustellen, dass alle Benutzer von Datenlakes die benötigten Daten effektiv lokalisieren können, sollte ein Metadaten-Katalog mit Informationen üb ȁѕ锰 饕չ)ѕՅЁչɍ٥є%ɵѥ踁͡ɥ͕)չɝ͔ɕѝѕЁݕɑ)ѕͥɡ)MɕMɡͭɽɍٕɹIѱUѕȴ)չѕЁݕɑͥݕ͕ѱ-єȁѕ )%ѥչՙչȁչѕ͍ѕ锰)ѕͅЁݕɑչȁYЁȁ Ȱ)՘ѕͽݽխɥЁ́Ս՝ɕ͕)ٕɹչMɡͭɽȁչѽѥͥЁ͕չѥ)՘͍ѱɑչչѕɹMɡ͉ɽչ)ɕɕ)%չͥɕ ЁAɅѥ́ȁѕѕɅѥՙ)́ѕ́ɝѕ+$MɡͭѕЃLȁͅєMɡͭѕа͍})i՝ɥͭɽQչYɅݽѱѕͽєȁYȴ)չݥ͍MѕɍѕɟЁݕɑ՘͔)]͔Ёͥɝѕа́%ѥɕѥɕٽѕ)Iѱݥ͍Mѕѱͥ+$%ѥѕL%ѥѕͽѕȁMѕݕѱ)͕i݅ͳՙݕɑѕɕ饕аմ1չͅɑչ)ԁɛ񱱕쁕ѱ%ѥѕݥ͍Mѕѕ(؁Q!=AA1HM=55H